|
Osiągnięcie
jest wspólnym dziełem partnerów INSDC -
EMBL-Bank (zlokalizowanego w Europejskim
Instytucie Bioinformatyki (EBI) działającym
przy Europejskim Laboratorium Biologii
Molekularnej (EMBL) w Hinxton w Wielkiej
Brytanii), GenBank z USA oraz Japońskiego
Banku Danych DNA - uzyskanym dzięki polityce
wymiany danych. Te trzy organizacje wymieniają
dane na temat sekwencji nukleotydów za pośrednictwem
systemu globalnej wymiany informacji
biologicznych, w celu jak najszybszego
zapewnienia środowisku naukowemu swobodnego
dostępu do wszystkich sekwencji.
Cztery zasady - adenina (A), tymina (T),
guanina (G) i cytozyna (C) - połączone w
pary układają się w długi łańcuch, tworząc
znajomą podwójnie spiralną postać kwasu
dezoksyrybonukleinowego (DNA). Połączenia między
parami zasad - A z T i C z G poprzez wiązania
wodorowe - mogą zostać zerwane w celu
"rozplątania" dwóch nici podwójnej
spirali.
Genetyczne informacje są kodowane w DNA
poprzez kolejność występowania zasad w
sekwencji. Sekwencje można w konwencjonalny
sposób opisać wymieniając po kolei
pojedyncze zasady (lub nukleotydy) na jednej z
dwóch nitek (np. CCAAATATGGATT), i taki właśnie
rodzaj informacji, wraz z adnotacjami określającymi
gatunek pochodzenia i funkcje, przechowywany
jest w bazach danych INSDC.
- Jest to istotny etap w historii rozwoju
baz danych sekwencji nukleotydów -
powiedział Graham Cameron, wicedyrektor
Europejskiego Instytutu Bioinformatyki EMBL. -
Począwszy od pierwszego wpisu w Bibliotece
Danych EMBL, udostępnionego w 1982 r., aż do
dzisiejszych 55 milionów sekwencji pochodzących
z co najmniej 200 tysięcy różnych organizmów,
zasoby te wyprzedzały potrzeby biologów
molekularnych i wychodziły im naprzeciw - często
przy poważnym braku zasobów.
Formalnie INSC powstał w lutym 1987 r. i
korzenie wszystkich trzech baz sięgają lat
osiemdziesiątych: EMBL-Bank, obecnie
zlokalizowany w EBI w Wielkiej Brytanii, został
uruchomiony jako Biblioteka Danych EMBL w
Heidelbergu w Niemczech, amerykański GenBank
został założony wkrótce potem przy
Krajowym Laboratorium Los Alamos, przed
przeniesieniem go do Krajowego Ośrodka
Informacji Biotechnologicznych w Bethesdzie w
USA, zaś Japoński Bank Danych DNA został
utworzony przy Krajowym Instytucie Genetyki w
Mishima w 1986 r.
David Lipman, dyrektor Krajowego Ośrodka
Informacji Biotechnologicznych, wyjaśnił
dalej: - Dzisiejsze bazy danych nukleotydów
pozwalają badaczom na wspólne korzystanie ze
skompletowanych genomów, genetycznego składu
całych ekosystemów oraz opatentowanych
sekwencji.
Początkowo dane były rozpowszechniane na taśmie
magnetycznej i wprowadzane ręcznie lub za
pomocą dyskietki. Te sposoby zostały wyparte
przez potokowe przetwarzanie danych pochodzących
z projektów zajmujących się
sekwencjonowaniem genomów i Europejskiego Urzędu
Patentowego, zapewniając jak najszybsze udostępnienie
wszystkich sekwencji w publicznej domenie.
Naukowcy mogą również przekazywać dane
bezpośrednio do którejkolwiek z organizacji
i, dzięki zharmonizowanym modelom danych w
trzech bazach, sekwencje są automatycznie
wymieniane podczas nocnego przetwarzania w
celu udostępnienia danych we wszystkich
trzech lokalizacjach.
Dane dotyczące sekwencji były najpierw
wprowadzane ręcznie z czasopism naukowych,
ale przez lata proces ten także ewaluował i
bezpośrednie zasilanie baz danych sekwencjami
nukleotydów stało się elementem procesu
publikacji. Zasada ta została rozszerzona na
inne obszary, w tym proteomikę i modele
procesów biologicznych.
- INSDC stworzyła fundamenty wymiany wielu
rodzajów informacji biologicznych -
powiedział Takashi Gojobori, dyrektor Ośrodka
Informacji Biologicznej i Japońskiego Banku
Danych DNA. - Ponieważ wkroczyliśmy w erę
biologii systemów i naukowcy zaczynają
wymieniać złożone informacje, takie jak
wyniki eksperymentów polegających na
pomiarach aktywności tysięcy genów, lub
modele obliczeniowe całych procesów, istotne
jest docenienie osiągnięć związanych z
tymi trzema bazami danych, które zapoczątkowały
otwartą wymianę informacji biologicznych.
Więcej informacji na temat projektu międzynarodowej
współpracy w zakresie baz danych sekwencji
nukleotydów INSDC znajduje się na stronie: www.insdc.org.
|