UCSC pretraživač genoma
UCSC pretraživač genoma | |
---|---|
UCSC pretraživač genoma je on-line i može se preuzeti, pretraživanjem genoma, a domaćin je Kalifornijski univerzitet, Santa Cruz (UCSC).[1][2][3] To je interaktivna web stranica koja nudi pristup podacima o sekvencama genoma različitih vrsta kičmenjaka i beskičmenjaka i glavnih organizama, integrirana s velikom kolekcijom poravnatih bilješki. Preglednik je grafički optimiziran za podršku brzih interaktivnih performansi i paket alata otvorenog koda, zasnovan na mreži, izgrađen na vrhu MySQL baze podataka za brzu vizualizaciju I proučavanje podataka na mnogim nivoima. Baza podataka pretraživača Genome, alati za pregledavanje, datoteke podataka koje se mogu preuzeti i dokumentacija mogu se naći na web lokaciji UCSC Genome Bioinformatics.
Genomi
[uredi | uredi izvor]U godinama od svog osnivanja, pretraživač UCSC proširio se kako bi prilagodio sekvence genoma svih vrsta kičmenjaka i odabranih beskičmenjaka, za koje su dostupne genomske sekvence velikog pokrića, sada uključuje 46 vrsta. Visoka pokrivenost je neophodna da bi se omogućilo preklapanje usmjeravanja izgradnje većih susjednih regija. Genomske sekvence s manjom pokrivenošću uključene su u puteve s višestrukim poravnavanjem u nekim preglednicima, ali usitnjena priroda ovih sklopova ne čini ih pogodnima za izgradnju pregledača s punim karakteristikama. Vrste hostirane sa pretrživačima genoma s punim karakteristikama prikazane su u tabeli.
Veliki majmuni | Čovjek, babun, bonobo, čimpanze, giboni, gorile, orangutani | - | Nevelikomajmunski primati | Grmljanski mali majmun, marmozet, mišji lemur, rezus makak, vjeveričasti majmun, tarzijus, verirovka | - | Sisari koji nisu primati | Miš, alpaka, armadilo, mačka, kineski hrčak, krava, pas, delin, slon, tvor, zamorčić, jež, konj, krngur pacov, morska krava, kit minke, gola krtica, oposum, panda, svinja, pika, kljunar, zec, štakor, hiraks, ovca, rovčica, ljenivac, vjeverica, tasmanski džavo, tenrek, valabi, bijeli nosorog | - | Hordati koji nisu sisari | Američki aligator, atlantski bakalar, talasasti papagaj, pilići, kelakant, morski pas-slon, fugu, lampaj, gušter, medaka, srednja zeba, nilska tilapija, oslikana kornjača, palica, tetraodon, ćurka, Xenopus tropicalis , zebrica | - | Beskičmenjaci | Caenorhabditis spp (5), Drosophila spp. (11), medonosna pčela, lancelet, komarac, P. pacificus, morski zec, morska šprica, morski jež, kvasac | - | Virusi | Ebola, SARS-CoV-2 koronavirus | - |
---|
Pomoću čvorišta sklopova korisnici mogu učitati jedinstvene sklopove. Primjer se može vidjeti u Projektu genoma kičmenjaka skupnom čvorištu.
Funkcionalnost pretraživača
[uredi | uredi izvor]Velika količina podataka o biološkim sistemima koja se akumulira u literaturi čini neophodnim prikupljanje i varenje informacija pomoću bioinformatičkih alata. Preglednik genoma UCSC predstavlja raznoliku zbirku skupova podataka o anotacijama (poznatih kao "tragovi" i predstavljeni grafički), uključujući poravnanje mRNK, mapiranje ponavljajućih elemenata u DNK, predviđanja gena, podatke o ekspresiji gena I asociranim bolestima (koji predstavljaju vezu gena sa bolestima) i mapiranja komercijalno dostupnih genskih čipova (npr. Illumina i Agilent). Osnovna paradigma izlaza je prikazivanje sekvence genoma u vodoravnoj dimenziji i grafičkih prikaza lokacija mRNK, predviđanja gena itd. Blokovi boja duž koordinatne osi pokazuju lokacije poravnanja različitih tipova podataka . Sposobnost da se pokaže ovoliko velika raznolikost tipova podataka na jednoj koordinatnoj osi čini preglednik praktičnim alatom za vertikalnu integraciju podataka.
Da bi pronašao određeni gen ili genomsku regiju, korisnik može upisati ime gena, sekvencu DNK, pristupni broj za RNK, naziv genomske citogenetičke pruge (npr. 20p13 za traku 13 na kratkom kraku hromosoma 20) ili hromosomski položaj (chr17: 38,450,000-38,531,000 za regiju oko gena BRCA1).
Predstavljanje podataka u grafičkom formatu omogućava pretraživaču da prikaže pristup linku do detaljnih informacija o bilo kojoj od napomena. Stranica s detaljima gena na stazi UCSC Geni pruža veliki broj veza do specifičnijih informacija o genu u mnogim drugim resursima podataka, poput mrežnog Mendelovskog nasljeđivanja kod čovjeka (OMIM) i SwissProt.
Dizajniran za prezentaciju složenih i obimnih podataka, UCSC pretraživač je optimizovan za brzinu. Prethodnim poravnavanjem 55 miliona RNK u [[GenBank],] sa svakim od 81 sklopova genoma (mnogi od 46 tipova imaju više od jednog sklopa), pregledač omogućava trenutni pristup poravnanjima bilo koje RNK sa bilo kojim od hostovanih vrsta.
Supostavljanje mnogih vrsta podataka, omogućava da se prikažu tačna kombinacija podataka koja će odgovoriti na određena pitanja. Funkcija izlaza pdf /postscript omogućuje izvoz slike spremne za kameru za objavljivanje u akademskim časopisima.
Jedinstvena i korisna karakteristika koja razlikuje UCSC pretraživač od ostalih pregledača genoma je kontinuirano promenljiva priroda prikaza. Može se prikazati sekvenca bilo koje veličine, od jedne DNK baze do čitavog hromosoma (ljudski hr1 = 245 miliona baza, Mb) sa potpunim oznakama. Može se prikazati jedan gen, jedan egzon ili čitava hromosomska pruga/bend, pokazujući desetine ili stotine gena i bilo koju kombinaciju mnogih oznaka. Pogodna funkcija povlačenja i zumiranja omogućava korisniku da odabere bilo koju regiju na slici genoma i proširi je kako bi zauzela cijeli ekran.
Također se može koristiti pretraživač za prikaz vlastitih podataka putem alata Prilagođene staze. Ova značajka omogućava korisnicima da prenose datoteku vlastitih podataka i pregledavaju podatke u kontekstu referentnog sklopa genoma. Korisnici mogu naći i podatke koje hostuje UCSC, stvarajući podskup podataka po svom izboru pomoću alata Preglednik tabela (kao što su samo Jednonukleotidni polimorfizmi (SNP), koji mijenjaju aminokiselinsku sekvencu proteina) prikazati ovaj specifični podskup podataka u pregledniku, kao prilagođeno praćenje.
Bilo koji prikaz preglednika koji je kreirao korisnik, uključujući onaj koji sadrži prilagođene staze, može se dijeliti s drugim korisnicima putem alata Spremljene sesije.
Također pogledajte
[uredi | uredi izvor]Reference
[uredi | uredi izvor]- ^ Fujita PA, Rhead B, Zweig AS, Hinrichs AS, Karolchik D, Cline MS, Goldman M, Barber GP, Clawson H, Coelho A, Diekhans M, Dreszer TR, Giardine BM, Harte RA, Hillman-Jackson J, Hsu F, Kirkup V, Kuhn RM, Learned K, Li CH, Meyer LR, Pohl A, Raney BJ, Rosenbloom KR, Smith KE, Haussler D, Kent WJ (Jan 2011). "The UCSC Genome Browser database: update 2011". Nucleic Acids Res. 39 (Database issue): D876-82. doi:10.1093/nar/gkq963. PMC 3242726. PMID 20959295.
- ^ Kent WJ, Sugnet CW, Furey TS, Roskin KM, Pringle TH, Zahler AM, Haussler D (juni 2002). "The human genome browser at UCSC". Genome Res. 12 (6): 996–1006. doi:10.1101/gr.229102. PMC 186604. PMID 12045153.
- ^ Kuhn, R. M.; Karolchik, D.; Zweig, A. S.; Wang, T.; Smith, K. E.; Rosenbloom, K. R.; Rhead, B.; Raney, B. J.; Pohl, A.; Pheasant, M.; Meyer, L. (1. 1. 2009). "The UCSC Genome Browser Database: update 2009". Nucleic Acids Research (jezik: engleski). 37 (Database): D755–D761. doi:10.1093/nar/gkn875. ISSN 0305-1048. PMC 2686463. PMID 18996895.