Mine sisu juurde

Sekveneerimine

Allikas: Vikipeedia

Sekveneerimineehkjärjestusanalüüsehkjärjendamine(inglisesequencing) onmonomeeride(nukleotiidide,aminohapete) järjestuse kindlaksmääramine informatsioonilistebiopolümeeride(DNA,RNA,valkude) molekulides.

Sekveneerimine annab tulemuseks märkidest koosneva tõlgenduse, mida nimetatakse sekventsiks, ja kirjeldab suuremat osa sekveneeritud molekulist. "Suuremat osa" kirjeldab ta sellepärast, et sekveneerimismeetodid ei ole täiuslikud. NäiteksDNAd sekveneeridesantakse järjestus nelja erinevanukleiinhappejäägijadana (lühendatultA,T,C,G), kuid rakus endas võivad need olla modifitseeritud ehk sekveneerimisel tulemuseks saadudAei pruugi olla sama rakus päriselt olevamonomeeriga.Samuti annab sekveneerimine tulemusekspolümeerijärjestuse, kuid ruumiline struktuur tuleb leida teiste meetodite abil ja see võib olla vägagi keeruline.

Sekveneerimine on tänapäeva bioteaduste alal üks vajalikumaid tehnikaid. Ilma selleta oleks näiteks pea võimatu koostadaevolutsioonipuidvõi arendada välja kindlaid mehhanisme sihtivaidravimeidja isegi teada neidsamu mehhanisme tuvastada, sest kõige selle jaoks oli vähemalt mingis etapis kasutatud biomolekulide sekveneerimist.

Kronoloogia[muuda|muuda lähteteksti]

1943. aastal näitasidOswald Avery,Colin MacLeodjaMaclin McCarty,et DNA kannab pärilikkuse informatsiooni.[1]

1951. aastal tegiFrederick Sangerkindlaks veiseinsuliiniaminohappelisejärjestuse.[2]

1953. aastal avaldasidJames D. WatsonjaFrancis Crickartikli DNAkaksikheeliksmudelikohta.[3]

1957. aastal sõnastasF. Crickmolekulaarbioloogia põhidogma.[4]

1965. aastal suudeti sekveneerida 77-nukleotiidiline lõik seenetRNAst(Robert W. Holleygrupp).

1977. aastal avaldasidAllan MaxamjaWalter Gilbertartikli "DNA sequencing by chemical degradation"(DNA sekveneerimine keemilise degradatsiooni abil),[5] Frederick Sanger tuli samal ajal välja enda meetodiga, DNA sekveneerimine ahelaterminatsiooniabil.[6]

1984. aastal dešifreerisidMedical Research CounsiliteadlasedEpsteini-Barri viirusekogugenoomi(170 kb)[7]

1987. aastal tuliApplied Biosystemsturule esimese automatiseeritud sekvenaatoriga, mudel ABI 370.

1990. aastal alustati projektiga sekveneerimaks inimese genoomi (Human Genome ProjectHGP).[7]

1996. aastal leiutasidPål NyrénjaMostafa Ronaghipürosekveneerimise.[8]

1998 alustasCelera Genomicsenda projektiga sekveneerimaks inimese genoomi.

2000. aastal tuliLynx Therapeuticsvälja esimese, kuid kohmaka järgmise põlvkonna sekvenaatoriga.[9]

2001. aastal avaldasid nii Human Genome Project kui ka Celera enda esialgsed genoomid.[10][11]

2004. aastal tuli454 Life Sciencesvälja pürosekveneerimisel põhineva järgmise põlvkonna sekvenaatoriga, mis vähendas sekveneerimishindu automatiseeritudSangeri sekvenaatorigavõrreldes kuuekordselt.[12]

DNA sekveneerimine[muuda|muuda lähteteksti]

Pikemalt artiklisDNA sekveneerimine

DNA sekveneerimiseks kutsutakse DNA molekuliprimaarse struktuurinukleotiidse järjestuse määramist. Hiljutise ajani on sekveneerimisel rohkem kasutatud ahela terminatsiooni ehkSangeri meetodit(inglise keeleschain termination methodvõiSanger sequencing), mille arendasid välja Frederick Sanger jaAlan Coulson1970. aastate teisel poolel.[6]Samaaegselt tulid oma sekveneerimise taktikaga välja ka ameeriklased Allan Maxam ja Walter Gilbert, kuid nende meetod kaotas oma populaarsuse, kuna Sangeri meetodit sai kergemini automatiseerida ja ohtlikke reagente kasutati märgatavalt vähem. Tänapäeval tuleb suurem osa sekveneerimisandmetest "järgmise põlvkonna sekveneerimise"(inglise keeles NGS ehkNext Generation Sequencing) platvormidelt, mille tehnoloogiad on erinevate korporatsioonide patentidega kaitstud ja seetõttu üksteisest erinevad. Enamiku NGS tehnoloogiate ühiseks omaduseks on see, et pinnal paigal olevate DNA juppide (inglise keelestemplate) alusel sünteesitaksekomplementaarnevastasahel, mida tehes registreeritakse iga lisatud nukleotiidi korral kiirgus või keemiline signaal. Üleüldiselt iseloomustab sääraseid tehnikaid "sünteesi abil sekveneerimine" (inglise keelessequencing by synthesis). DNA järjestus hoiab endas vajalikku informatsiooni, mis laseb elusorganismidel ellu jääda ja paljuneda. Seetõttu on DNA järjestuse teadmine oluline nii baasteadustes kui rakendusteadustes. DNA sekveneerimise tähtsust suurendab ka see, et seda leidub kõigis elusorganismides, tehes selle kasutatavaks põhimõtteliselt kõikidel bioloogia aladel. Näiteks meditsiinis saab seda kasutada haiguste identifitseerimiseks ja potentsiaalselt ka ravi väljatöötamiseks erinevatele geneetilistele haigustele. Sama käib ka erinevatepatogeenidekohta.

Sangeri sekveneerimine[muuda|muuda lähteteksti]

Vasakul sekvents geeliradadel, paremal sekvenaatorist tulnud pilt

Sangeri sekveneerimise ehk ahela termineerimise metoodika oli 1980. aastatest alates põhiline DNA sekveneerimise meetod (laialdane kasutus tänapäevalgi).[13]Järgmise põlvkonna sekveneerimistehnoloogiad on hakanud eelmise kümnendi keskpaigast alates sekveneerimist enda peale võtma ja enamik sekveneerimise informatsioonist tuleb tänapäeval sealt. Sellegipoolest ei tasuks alahinnata selle meetodi panust bioteadustesse. Suurem osa eri liikide genoome, mis sekveneeriti enne järgmise põlvkonna sekvenaatorite ajastut (sealhulgas ka inimese oma), sekveneeriti selle sama metoodika abil. Lisaks kasutati Sangeri sekveneerimist ka teiste biopolümeeride, valkude ja RNA, kaudseks sekveneerimiseks, sest nende sekveneerimine otse on keerukam.

Ahela terminatsiooni meetod vajab üheahelalist DNAd, DNApraimerit,polümeraasi,vastavaiddesoksüribonukleotiidtrifosfaate(dNTP) ja modifitseeritud nukleotiide (didesoksüNTP-de ddNTP), millel puuduvad sünteesi jätkamiseks vajalikud 3’-OH rühmad. Kõigepealt liituvad DNA praimerid DNAmaatriksmolekuligatäpselt samast kohast, siis seondub sinna DNA polümeraas. Edasine põhimõte seisneb algsele üheahelalisele DNA molekulile komplementaarse vastasahela sünteesis sel moel, et vastasahela süntees katkeks juhuslikul hetkel, kuid kindlat tüüpi nukleotiidi (kas siis A, T, C või G) juures. Algselt saavutati see, viies vastasahela süntees läbi neljas eri reaktsiooninõus, kus igas nõus asus vaid ühte tüüpi ddNTPd. Kuna igas nõus on korraga väga palju samasuguseid DNA maatriksmolekule, tekib ddNTPde juhuslikul ahelasse liitumisel suur kogus erineva pikkusega DNA ahelaid, mis lõppevad kindla nukleotiidiga. Need ahelad tuleb siis panna kõrge lahutusvõimega geelile, iga reaktsioonitüüp eri rajale ja sealt lahutuvad nad pikkuse alusel kindlasse järjekorda. Nelja rada korraga vaadates saab DNA järjestuse kindlaks teha. Automatiseeritud masinates kasutatakse reaktsioonisegus nelja eri ddNTPd korraga, iga ddNTP eri värvigafluorestseerivaltmärgistatud. Tänu sellele ei ole vajadust reaktsiooni neljas eri nõus läbi viia ja ka geelil, mis asub masinates kapillaari sees, piisab ühest ainsast rajast, et järjestus edukalt välja lugeda. ddNTP (varem märgistati ka praimereid ning dNTP-sid) märgistatakse kas fluorestsentselt või radioaktiivselt, et hiljem eri nukleotiididel vahet teha. Siis viiakse nende koostisosade abil läbi DNA vastasahela süntees, mis mingil hetkel lülitab endasse ka ddNTP, mille peale ahela süntees lõpeb. Pärast sedadenatureeritaksereaktsioonisegu ja sünteesitud eri pikkustega DNA ahelad liiguvad geelil eri kiirusega, ja on seetõttu eristatavad. Algupärases meetodis pandi iga ddNTP-ga tehtud reaktsioonpolüakrüül-uurea geelieri rajale ja saadi selle kaudu sekvents teada, kuid tänapäeval saab eri lainepikkusega fluorestseeruva ddNTP kaudu teha neil vahet ka läbi ühe raja jooksutades. Automatiseeritud masinates on see rada kapillaari sees, mis jookseb mõõteandurite eest läbi, andes sellega järjestuse.

Järgmise põlvkonna sekveneerimine[muuda|muuda lähteteksti]

KuigiInimese Genoomi Projekt(HPG) oli edukas, olid ka selle kulud väga suured: 13 aastat kestnud projekti hinnaks kujunes üle 3 miljardi dollari.[14]Kuna vajadus ülegenoomsete andmete järele oli väga suur, siis tuli leida uusi ja odavamaid viise DNA sekveneerimiseks. Suuna näitas kätte Lynx Therapeuticsi RNA sekvenaator. Sellel tehnikal oli küllaldaselt vigu, näiteks lühikesedreadidepikkused (17–20aluspaari), kuidmassiivse paralleelse sekveneerimisepõhimõttel oli potentsiaal ühe sekveneerimisega genereerida üüratul hulgal andmeid. Esimesena tulid enda NGS platvormiga välja Jonathan Rothbergi asutatud454 Corporation(aastal 2004). Samal ajal töötasidS. BalasubramanianjaD. Klenermanvälja enda sekveneerimistehnoloogiat ja asutasid firmaSolexa.Nende sekvenaator oli esimene instrument, mis oli võimeline genereerima 1 GB andmeid ühe jooksuga. Esialgsedreadidolid aga kõigest 26 aluspaari pikad, kuid nende tehnoloogias oli potentsiaali ja aastal 2007 maksisIlluminaselle tehnoloogia eest 600 miljonit USA dollarit.George Churchja tema kolleegid tulid 2005 välja enda sekveneerimistaktikaga, mille ostis äraApplied Biosystems.Need kolm firmat on haaranud suurema osa teise põlvkonna sekvenaatorite tootmise turust ja esialgsed seadmete andmetootmismahud on suurenenud sadu kordi.[14]

Erinevates teise põlvkonna sekveneerimisplatvormides kasutatakse erinevaid, üksteisele järgnevaid tehnikaid, kuid neid saab sarnasuste abil koondada järgmiselt: maatritsi (inglise keelestemplate) valmistamine, sekveneerimine ja signaali lugemine.[13]

Illumina platvormid kasutavad sünteesi abil järjestamise tehnoloogiat (inglise keelesSequencing by Synthesis,lühend SBS), mis loodi aastal 1998 toona firma Solexa asutajate poolt. Alguses tuleb valmistadaDNA-genoteekehk genoomiraamatukogu (inglise keeleslibrary), mis kujutab endast ühtlase pikkusega adapteritega DNA juppe. Siis tuleb genoteegis olevad jupid seondada pinnale, millelt toimub hilisem sekventsi väljalugemine, ning enamikul platvormidel toimub selles kohas ka kohalikPCRvõimendus. Illumina puhul näeb see protsess välja nii, et DNA-genoteegi üksik molekul seondub kiibile kusagile suvalisele kohale, mis asub teistest genoteegi molekulidest suhteliselt kaugel ja sinna moodustub spetsiaalse PCR lahenduse kaudu tihe grupp samu molekule.[13][15]Sealt edasi toimub kõikidel platvormidel erinev, kuid põhimõttelt mingisugust sünteesireaktsiooni kasutav vastasahela süntees, kus iga uue nukleotiidi võioligomeerilisandumisel registreeritakse mingisugune signaal (enamasti kindla lainepikkusega valgus). Kuigi kiipidele paigutumine oli algselt juhuslik, ei muutu maatriksahela asukoht ja seade on võimeline järjestama samast asukohast pärit olevaid signaalereadiks.Siit tulebki NGS platvormide suur eelis Sangeri sekvenaatorite ees, sest kuigi Sangeri sekvenaatorid genereerivad enamasti pikemaidreade,ei ole võimalik paigutada nii paljusid kapillaare paralleelselt, kui seda NGS platvormid suudavad. Näiteks loeb Illumina võimsaim masin järjestusi ühelt kiibilt (flow cell) paralleelselt 3 miljardist positsioonist.[16]

NGS sekvenaatoritest tulevad toorandmed koosnevad suhteliselt lühikestest juppidest. Olenevalt platvormist on keskmised readid mõnikümmend kuni 700 aluspaari pikad.[13]Inimese puhul oleks sääraste juppide osalise kattuvuse abil genoomi koostamine tarbetult arvutusvõimsust kulutav operatsioon. Selle asemel võrreldakse neid juppe juba teada oleva genoomiga ja kaardistatakse need jupid sinna. Kogu protsess nõuab arvutitelt sellegipoolest väga palju ja tänapäeval on nende tehnoloogiate viga juba selles, et arvutusvõimsus ei kasva nii kiiresti, nagu kasvab andmete tekitamispotentsiaal.

Kolmanda põlvkonna sekveneerimine[muuda|muuda lähteteksti]

2022. aastal tuli Pacific Biosciences, lühidalt PacBio, välja uue lühikeste lugemite sekvenaatoriga ONSO, mis on 15 korda täpsem kui varasemadSequencing by Synthesistehnoloogiat kasutavad sekvenaatorid. ONSO põhineb tehnoloogialSequencing by Binding,lühendina SBB, mille andmete kvaliteet on kõrgtasemel Q40 Phredi skaala kvaliteediskoori järgi. Võrdluseks, Illumina sekvenaatorid on tasemel Q30.

Phredi skaala kvaliteediskoor[muuda|muuda lähteteksti]

Kvaliteediskoorid veamäära järgi on jagatud järgmiselt: Q20 - sekveneeritud 100 aluspaari võib sisaldada 1 viga. Q30 - sekveneeritud 1000 aluspaari võib sisaldada 1 viga. Q40 - sekveneeritud 10,000 aluspaari võib sisaldada 1 viga.

RNA sekveneerimine[muuda|muuda lähteteksti]

Pikemalt artiklisRNA sekveneerimine

RNA on sünteesitud DNA ahela pealt, kuid DNA sekveneerimine ei anna vastust selle kohta, missuguseid geene antud hetkel uuritavas koes/rakusekspresseeritakseja kuidas seda RNAd töödeldud on (vajalik näiteks vähiuuringutes). Selle jaoks läheb vaja sekveneerida ka RNAd. Kuna RNA ei säili tavakeskkonnas nii hästi ja DNA jaoks on sekveneerimine juba välja töötatud, seisneb RNA sekveneerimine uurimise all oleva RNA rikastatud prooviltcDNA(komplementaarne DNA) sünteesis ja siis selle sekveneerimises DNA sekvenaatoritega. RNA sekveneerimine erineb DNA sekveneerimisest suuremalt jaolt vaid genoomiraamatukogu valmistamises ja andmete analüüsis. Siin on erandiksHelicos Biosciences,kes arendab välja DRSTM (inglise keelessingle molecule direct RNA sequencing) platvormi.

RNA sekveneerimiseks tuleb kõigepealt rikastada eraldatud RNAd uuritavate molekulide suhtes. Kogu transkriptoomishotgun sequencing(RNA-Seq) puhul tähendaks seeribosomaalsest RNA-stlahti saamist, kuna see moodustab väga suure enamiku kogutranskribeeritavastRNAst. Levinuim viis selle tegemiseks on magnetiliste helmestega mRNApolüA sabapidi seondumine ja siis ülejäänud RNA väljapesemine. Sellele järgneb cDNA süntees ja fragmenteerimine soovitud pikkusega juppideks, pärast mida tuleb genoteeki töödelda vastavalt uurimuse ja platvormi vajadustele. Hilisem andmeanalüüs on tihti veelgi rohkem arvuteid koormav kui DNA sekveneerimistel, kuna mitte kõiki reade ei saa kaardistada referentsandmebaasidele ja mõnikord on vajalikde novojoondamine.[17][18]

Valkude sekveneerimine[muuda|muuda lähteteksti]

Pikemalt artiklisValkude sekveneerimine

Kui uuritavat valku kodeeriv geen on teada, siis on palju lihtsam sekveneerida selle geeni DNA võimRNAning sealt lugeda välja valgu aminohappeline järjestus. Et teada, mis geeni produkt see on, tuleb sekveneerida valgust lühike jupp (nt 15 aminohapet) ja kasutada seda infot, et luua komplementaarne marker valgu RNAle. Seda kasutades tuleb isoleerida vastav mRNA, mida siis omakorda sekveneerida. Muidugi tuleb arvestada võimalusega, et pärast translatsiooni muudetakse valgu järjestust ja seetõttu on mõnikord siiski vaja sekveneerida valku otse. Otseseks valkude sekveneerimiseks on kaheks valitsevaks meetodiksmassispektromeetriajaEdmani degradatsioon.

Automatiseeritud Edmani sekvenaatorid töötavad järgmiselt:

  1. Keemilisel teel valgu denatureerimine
  2. Kompleksvalgu puhul valgu eri ahelate eraldamine ja puhastus
  3. Eri aminohapete suhte määramine iga ahela jaoks eraldi
  4. Iga ahela jaoks terminaalsete aminohapete määramine
  5. Ahelate lühikesteks juppideks lagundamine (maksimaalselt 50 AH, sest Edmani degratsioon ei suuda pikemaidpolüpeptiidesekveneerida)
  6. Fragmentide üksteisest eraldamine
  7. Nende juppide aminohape-haaval tükkideks lagundamine ja iga aminohappe määramine ehk sekveneerimine ise.
  8. Kogu jada kordamine teistsuguse lõikemustri korral

Massispektromeetria puhul seeditakseendoproteaasiteel proteiin tükkideks ja need tükid lastakse läbikõrgsurvevedelikkromatograafiakolonni. Peptiidid pihustatakse kohe pärast nende kolonnist väljumist läbi tugeva positiivse pingega otsiku spektromeetrisse, kus laeng lahutab tilgad väikesteks fragmentideks, kuni iga tilk on vaid üksik ioon ja läbielektromagnetväljaliikudes eralduvad need laengu/massi suhte järgi detektori eri positsioonidele. Seda protsessi korratakse erinevateseedeensüümidegaja lõplik järjestus üritatakse selle põhjal välja arvutada.[19]

Viited[muuda|muuda lähteteksti]

  1. Avery O, MacLeod C, McCarty M (1944)."Studies on the chemical nature of the substance inducing transformation of pneumococcal types: induction of transformation by a desoxyribonucleic acid fraction isolated from pneumococcus type III".J Exp Med.79(2): 137–158.DOI:10.1084/jem.79.2.137.PMC2135445.PMID19871359.{{cite journal}}:CS1 hooldus: mitu nime: autorite loend (link)
  2. Sanger & Tuppy 1951a;Sanger & Tuppy 1951b;Sanger & Thompson 1953a;Sanger & Thompson 1953b
  3. Watson J.D. and Crick F.H.C. (1953)."A Structure for Deoxyribose Nucleic Acid"(PDF).Nature.171(4356): 737–738.Bibcode:1953Natur.171..737W.DOI:10.1038/171737a0.PMID13054692.
  4. Crick, F.H.C.On degenerate templates and the adaptor hypothesis (PDF).genome.wellcome.ac.uk (Lecture, 1955). Retrieved 22 December 2006.
  5. Maxam AM, Gilbert W (veebruar 1977)."A new method for sequencing DNA".Proc. Natl. Acad. Sci. U.S.A.74(2): 560–4.Bibcode:1977PNAS...74..560M.DOI:10.1073/pnas.74.2.560.PMC392330.PMID265521.
  6. 6,06,1Sanger F, Nicklen S, Coulson AR (detsember 1977)."DNA sequencing with chain-terminating inhibitors".Proc. Natl. Acad. Sci. U.S.A.74(12): 5463–7.Bibcode:1977PNAS...74.5463S.DOI:10.1073/pnas.74.12.5463.PMC431765.PMID271968.{{cite journal}}:CS1 hooldus: mitu nime: autorite loend (link)
  7. 7,07,1"Arhiivikoopia".Originaaliarhiivikoopia seisuga 19. jaanuar 2014.Vaadatud 3. detsembril 2012.{{netiviide}}:CS1 hooldus: arhiivikoopia kasutusel pealkirjana (link)
  8. M. Ronaghi, S. Karamohamed, B. Pettersson, M. Uhlen, and P. Nyren (1996). "Real-time DNA sequencing using detection of pyrophosphate release".Analytical Biochemistry.242(1): 84–9.DOI:10.1006/abio.1996.0432.PMID8923969.{{cite journal}}:CS1 hooldus: mitu nime: autorite loend (link)
  9. Brenner S; et al. (2000)."Gene expression analysis by massively parallel signature sequencing (MPSS) on microbead arrays".Nature Biotechnology.Nature Biotechnology.18(6): 630–634.DOI:10.1038/76469.PMID10835600.
  10. Lander ES; Linton LM; Birren B; et al. (veebruar 2001). "Initial sequencing and analysis of the human genome".Nature.409(6822): 860–921.DOI:10.1038/35057062.PMID11237011.
  11. Venter JC; Adams MD; Myers EW; et al. (veebruar 2001). "The sequence of the human genome".Science.291(5507): 1304–51.Bibcode:2001Sci...291.1304V.DOI:10.1126/science.1058040.PMID11181995.
  12. Stein RA (1. september 2008)."Next-Generation Sequencing Update".Genetic Engineering & Biotechnology News.28(15).
  13. 13,013,113,213,3Michael L. Metzker (2010). "Sequencing technologies – the next generation".Nature Reviews Genetics.11.DOI:10.1038/nrg2626.
  14. 14,014,1Lin Liu; et al. (2012). "Comparison of Next-Generation Sequencing Systems".Journal of Biomedicine and Biotechnology.2012.DOI:10.1155/2012/251364.{{cite journal}}:et al.-i üleliigne kasutus kohas:|author=(juhend)
  15. "Arhiivikoopia".Originaaliarhiivikoopia seisuga 9. jaanuar 2013.Vaadatud 3. detsembril 2012.{{netiviide}}:CS1 hooldus: arhiivikoopia kasutusel pealkirjana (link)
  16. "HiSeq Systems Comparison".Originaaliarhiivikoopia seisuga 14. oktoober 2012.Vaadatud 3. detsembril 2012.
  17. Paul Bertone:RNA sequencing
  18. Wang Z, Gerstein M, Snyder M. (jaanuar 2009)."RNA-Seq: a revolutionary tool for transcriptomics".Nature Reviews Genetics.10(1): 57–63.DOI:10.1038/nrg2484.PMC2949280.PMID19015660.{{cite journal}}:CS1 hooldus: mitu nime: autorite loend (link)
  19. Hanno Steen, Matthias Mann (2004). "The abc's (and xyz's) of peptide sequencing".Nature Reviews Molecular Cell Biology.DOI:10.1038/nrm1468.