Saltar ao contido

Estrutura primaria dos ácidos nucleicos

Na Galipedia, a Wikipedia en galego.
(Redirección desde «Secuencia de ADN»)
Para as técnicas para a determinación da secuencia do ADN versecuenciación do ADN.
Estrutura primaria dos ácidos nucleicosEstrutura secundaria dos ácidos nucleicosEstrutura terciaria dos ácidos nucleicosEstrutura cuaternaria dos ácidos nucleicos
A imaxe contén ligazóns clicables
A imaxe contén ligazóns clicables
Imaxe interactivadaestrutura dos ácidos nucleicos(primaria, secundaria, terciaria e cuaternaria) usandohélices de ADNe exemplos doribocima VS,atelomerasee onucleosoma.(PDBADNAPDB1BNAPDB4OCBPDB4R4VPDB1YMOPDB1EQZ)
Unha serie de codóns nun fragmento de molécula de ARNm. Cada codón consta de tres nucleótidos, que representan un determinado aminoácido.

Aestrutura primaria dos ácidos nucleicoé a sucesión denucleótidos(unidades que forman os ácidos nucleicos) representados polas letras A, T, G, C, U, que indica a orde en que estes están situados na molécula. Unhasecuencia de ácido nucleicooude nucleótidosé esa mesma sucesión nun ADN (letras A, T, G, C) ou nunARN(letras A, U, G, C). Por convención, as secuencias son xeralmente presentadas empezando poloextremo 5'e acabando poloextremo 3'.Como osácidos nucleicosson xeralmentepolímeroslineares (é dicir, non ramificados), especificar a súa secuencia equivale a definir a estrutura covalente da molécula enteira. Nesta estrutura primaria está codificada a información xenética dos seres vivos, polo que ás veces tamén se usa para ela a expresiónsecuencia xenética.As secuencias poden lerse a partir do material biolóxico utilizando diversos métodos desecuenciación do ADN.

Ademais da estrutura primaria (non se debe dicir "secuencia primaria" ), os ácidos nucleicos teñenestrutura secundaria,terciariae superiores.

Nucleótidos

[editar|editar a fonte]
Estrutura química do ARN.

Os ácidos nucleicos están formados por unha sucesión de moléculas chamadasnucleótidosunidas entre si por un enlace covalente chamadofosfodiéster.Os nucleótidos están formados por un fosfato, un azucre e unha base nutroxenada. Ofosfatonunca varía. Oazucreserve para distinguir o ADN (leva o azucredesoxirribosa) do ARN (levaribosa). Abase nitroxenada(ounucleobase) é o que distingue nun mesmo ácido nucleico un nucleótido doutro, polo que a secuencia dun ácido nucleico é tamén a súasecuencia de nucleótidosou a súasecuencia de bases.Segundo as bases nitroxenadas que leven hai cinco tipos de nucleótidos habituais nos ácidos nucleicos, que son:adenina(representado por A),guanina(G),citosina(C),timina(T) euracilo(U). No ADN aparecen A, T, G e C, e no ARN A, U, G e C. Nos ácidos nucleicos bicatenarios, como o ADN, as bases emparéllanse coas da cadea de enfronte formando sempre os pares A-T e G-C mediante o establecemento depontes de hidróxeno(outros emparellamentos non terían os grupos químicos adecuados para formar esas pontes de hidróxeno). Isto quere dicir que unha cadea écomplementariaen bases da outra.

Xeralmente unha secuencia de ADN escríbese coas bases seguidas (sen espazos entre elas) de esquerda a dereita desde o extremo 5' ao 3', por exemplo 5'-AAAGTCTGAC-3'. Durante atradución de proteínas,os ARNm son traducidos empezando polo extremo 5'. Por exemplo, a secuencia complementaria de 5'-TTAC-3' é 5'-GTAA-3' (obsérvese que as dúas están escritas en sentido 5'-3', pero nun ADN bicatenario estarán colocadas de forma antiparalela, polo que o primeiro T da primeira secuencia terá en fronte o o último A da segunda secuencia, e así as demais).

Na representación das secuencias de nucleótidos A, T, C, G e U representan a adenina, timina, citosina, guanina e uracilo, pero hai tamén letras para representar a ambigüidade nunha determinada posición, que podería estar ocupada por un nucleótido entre varios posibles. As regras daIUPACpara estes casos son:[1]

  • R= G A (unhapurina)
  • Y= T C (unhapirimidina)
  • K= G T (ceto)
  • M= A C (amino)
  • S= G C (enlazamento forte, con tres pontes de hidróxeno)
  • W= A T (enlazamento feble, con dúas pontes de hidróxeno)
  • B= G T C (todos excepto A)
  • D= G A T (todos menos C)
  • H= A C T (todos agás G)
  • V= G C A (todos excepto T)
  • N= A G C T (calquera)

Estes símbolos son tamén válidos para o ARN, pero nese caso U (uracilo) substituiría a T (timina).[1]

Ademais das bases habituais A, C, G, T e U, os ácidos nucleicos poden tamén conter bases modificadas despois de que se formou a cadea do ácido nucleico. No ADN, a base modificada máis común é a5-metilcitidina(m5C). No ARN, pode haber moitas bases modificadas, como apseudouridina(Ψ),dihìdrouridina(D),inosina(I),ribotimidina(rT) e7-metilguanosina(m7G).[2][3]Ahipoxantinae axantinason dúas das bases que se poden orixinar pola presenza demutáxenos.[4]De xeito similar, adesaminaciónda citosina orixina uracilo.

Importancia biolóxica

[editar|editar a fonte]
Representación docódigo xenético,no que a información contida nun ácido nucleico é traducida á secuencia de aminoácidos dunha proteína.

Nos sistemas biolóxicos, os ácidos nucleicos conteñen a información que utiliza unha célula viva para construír as súas proteínas específicas. A secuencia denucleobasesdunha cadea de ácido nucleico étraducidapola maquinaria celular nunha secuencia deaminoácidosformando unha cadea proteica. Cada grupo de tres bases, chamadocodón,corresponde a un determinadao aminoácido, e existe uncódigo xenéticoespecífico no que se asigna a cada posible combinación de tres bases un determinado aminoácido.

Odogma central da bioloxía molecularindica a dirección en que flúe a información xenética desde o ADN ata as proteínas. Primeiro, oADNtranscríbesea moléculas deARNm,que se dirixen aoribosoma,onde ese ARNm será utilizado como molde para a construción da proteína.

As mutacións causan cambios nos nucleótidos e, por tanto, nos codóns, polo que estas alteracións da secuencia do ADN dan lugar a que se formen proteínas con secuencias de aminoácidos distintas da nornal, que poden ser non funcionais. Algunhas mutacións poden facer que non sexa posible fabricar a proteína.

A secuenciación de xenomas enteiros ten grande importancia para establecer as relaciónsfiloxenéticasdos seres vivos. Secuenciáronse os xenomas de moitos microorganismos e duns cantos eucariotas. Un dos secuenciados foi oxenoma humano.É tamén importante o estudo depolimorfismos dun só nucleótidoou deindeis sinatura conservadose outros marcadores xenéticos.

Determinación da secuencia

[editar|editar a fonte]
Impresión dun electroferograma dun secuenciador automático para determinar parte dunha secuencia de ADN.
Artigo principal:secuenciación do ADN.

A secuenciación do ADN é o proceso de determinar a secuencia denucleótidosdun fragmento deADNdado. Como a secuencia do ADN dun ser vivo codifica a información necesaria para ese ser vivo, determinar a súa secuencia é útil na investigación fundamental de como funcionan os organismos, ou determinados individuos, e en practicamente todas as investigacións biolóxicas. Por exemplo, enmedicinapode utilizarse para identificar, diagnosticar e potencialmente desenvolver tratamentos para asenfermidades xenéticas.De igual xeito, a investigación dospatóxenospode levar a idear tratamentos para as enfermidades contaxiosas. Abiotecnoloxíaé unha disciplina florecente e con gran potencial, que utiliza moito a secuenciación do ADN.

O ARN non se secuencia directamente, senón que é copiado primeiro a ADN utilizando oencimatranscriptase inversa,e é ese ADN o que se secuencia.

Os métodos de secuenciación actuais dependen da capacidade discriminatoria das ADN polimerases, e, por tanto, só poden distinguir catro bases. Unhainosina(creada a partir deadenosinadurante aedición do ARN(RNA editing) lese como G, e a5-metilcitosina(creada a partir dacitosinapormetilación do ADN) lese como C. Coa tecnoloxía actual, é difícil secuenciar pequenas cantidades de ADN, xa que o sinal é demasiado feble para medilo, pero iso pódese solucionar facendo primeiro unha amplificación do ADN coa técnica dareacción en cadea da polimerase(PCR).

Representación dixital

[editar|editar a fonte]
Secuencia xenética en formato dixital.

Unha vez que se obtivo unha secuencia deácido nucleicodun organismo esta almacénase en formato dixital. As secuencias xenéticas dixitais poden ser almacenadas en bases de datos de secuencias, ser analizadas (verAnálise de secuenciasmáis abaixo), ser alteradas dixitalmente e utilizadas como moldes para crear novas moléculas de ADN reais utilizando asíntese de xenes artificial.

Análise de secuencias

[editar|editar a fonte]
Artigo principal:Análise de secuencias.

As secuencias xenéticas dixitais poden ser analizadas utilizando as ferramentasbioinformáticaspara intentar determinar a súa función.

Probas xenéticas

[editar|editar a fonte]

O ADN doxenomados organismos pode ser analizado para diagnosticar a susceptibilidade a ter enfermidades conxénitas, e pode tamén utilizarse para determinar a paternidade dun neno (pai xenético) ou os devanceiros dunha persoa. Normalmente, cada persoa leva dúas copias de cadaxene,unha herdada da nai e outra do pai, e estas copias poden ser iguais ou pertencer a variedades distintas (alelos) dese xene. Oxenoma humanocrese que contén arredor de 20.000 - 25.000 xenes. Ademais as probas xenéticas en senso amplo inclúen probasbioquímicaspara a posible presenza de enfermidades xenéticas, ou formas mutantes de xenes asociados co incremento do risco de desenvolver trastornos xenéticos.

As probas xenéticas identifican cambios noscromosomas,xenes,ouproteínas.[5]Xeralmente, as probas utilízanse para detectar cambios que están asociados con trastornos herdados e poden confirmar ou excluír unha condición xenética sospeitada e determinar a probabilidade de desenvolvela ou transmitila á descendencia.[6][7]

Aliñamento de secuencias

[editar|editar a fonte]
Artigo principal:Aliñamento de secuencias.

En bioinformática, unaliñamento de secuenciasé un modo de dispoñer as secuencias de ADN, ARN, ou proteína para identificar rexións semellantes que poden selo debido a relacións funcionais, estruturais, ou evolutivas entre as secuencias.[8]Se dúas secuencias dun aliñamento comparten un antepasado común, as faltas de correspondencia poden interpretarse comomutacións puntuaise as lagoas (gaps) como mutacións porinserciónoudeleción(indeis) introducidos nunha ou en ambas as liñaxes no período de tempo que pasou desde que diverxiron unha da outra. Nos aliñamentos de secuencias de proteínas, o grao de semellanza entreaminoácidosque ocupan unha determinada posición na secuencia pode ser interpretada como unha medidagrosso mododoconservadaque está unha determinada rexión ousecuencia motivoentre distintas liñaxes. A ausencia de substitucións, ou a presenza unicamente de substitucións moiconservadoras(é dicir, a substitución de aminoácidos cuxas cadeas laterais teñen propiedades bioquímicas similares) nunha determinada rexión da secuencia, suxiren[9]que esta rexión ten unha importancia estrutural ou funcional. Aínda que as bases nitroxenadas do ADN e ARN son máis similares entre si que cos aminoácidos, a conservación dos pares de bases pode indicar un papel funcional ou estrutural similar.

Afiloxenética computacionalfai un amplo uso dos aliñamentos de secuencia na construción e interpretación de árbores filoxenéticas, que se utilizan para clasificar as relacións evolutivas entre xenes homólogos representados nos xenomas de especies diverxentes. O grao no cal as secuencias dun conxunto estudado difiren está cualitativamente relacionado coa distancia evolutiva entre as secuencias. En xeral, unha alta identidade de secuencia indica que as secuencias en cuestión teñen unantepasado común máis recentecomparativamente recente, mentres que unha baixa identidade indica que a diverxencia é máis antiga. Esta aproximación, que reflicte a hipótese do "reloxo molecular"de que se pode usar un taxa case constante de cambio evolutivo para extrapolar o tempo que pasou desde que diverxiron dous xenes (é dicir, o tempo decoalescencia), asume que os efectos damutacióne aselección naturalson constantes entre as liñaxes. Por tanto, non considera posibles diferenzas entre organismos ou especies nas taxas dereparación do ADNou a posible conservación funcional de rexións específicas dunha secuencia. (No caso das secuencias de nucleótidos, a hipótese do reloxo molecular na súa forma máis básica tampouco ten en conta as diferenzas nas taxas de aceptación entremutacións silenciosasque non alteran o significado dun determinadocodóne outras mutacións que dan lugar á incorporación dun aminoácido diferente nas proteína)s. Outros métodos estatísticos máis exactos permiten que varíe a taxa de evolución en cada póla da árbore filoxenética, producindo así mellores estimacións dos tempos de coalescencia para os xenes.

Secuencia motivo

[editar|editar a fonte]
Artigo principal:Secuencia motivo.

Frecuentemente, a estrutura primaria codifica motivos que teñen importancia funcional. Algúns exemplos de secuencias motivo son: a caixa C/D[10] e a caixa H/ACA[11] dossnoRNAs,sitio de unión Smque se encontra nos ARNs doespliceosomacomo oU1,U2,U4,U5,U6,U12eU3,asecuencia Shine-Dalgarno,[12] asecuencia consenso Kozak[13] e a doterminadordaARN polimerase III.[14]

  1. 1,01,1Nomenclature for Incompletely Specified Bases in Nucleic Acid Sequences,NC-IUB, 1984.
  2. "BIOL2060: Translation".Arquivado dendeo orixinalo 25 de xullo de 2017.Consultado o 08 de xullo de 2013.
  3. Research
  4. T Nguyen, D Brunson, C L Crespi, B W Penman, J S Wishnok, and S R Tannenbaum,DNA damage and mutation in human cells exposed to nitric oxide in vitro,Proc Natl Acad Sci U S A. 1992 April 1; 89(7): 3030–3034
  5. "What is genetic testing? - Genetics Home Reference".Arquivado dendeo orixinalo 29 de maio de 2006.Consultado o 08 de xullo de 2013.
  6. Genetic Testing: MedlinePlus
  7. "Definitions of Genetic Testing".Definitions of Genetic Testing (Jorge Sequeiros and Bárbara Guimarães).EuroGentest Network of Excellence Project. 2008-09-11. Arquivado dendeo orixinalo 23 de maio de 2018.Consultado o2008-08-10.
  8. Mount DM. (2004).Bioinformatics: Sequence and Genome Analysis(2nd ed.). Cold Spring Harbor Laboratory Press: Cold Spring Harbor, NY.ISBN0-87969-608-7.
  9. Ng PC, Henikoff S. Predicting deleterious amino acid substitutions. Genome Res. 2001 May;11(5):863-74.
  10. Samarsky, DA; Fournier MJ, Singer RH, Bertrand E (1998)."The snoRNA box C/D motif directs nucleolar targeting and also couples snoRNA synthesis and localization".EMBO17(13): 3747–3757.PMC1170710.PMID9649444.doi:10.1093/emboj/17.13.3747.
  11. Ganot, Philippe; Caizergues-Ferrer, Michèle; Kiss, Tamás (1 April 1997). "The family of box ACA small nucleolar RNAs is defined by an evolutionarily conserved secondary structure and ubiquitous sequence elements essential for RNA accumulation". Genes & Development 11 (7): 941–956. doi:10.1101/gad.11.7.941.PMID 9106664.
  12. Shine J, Dalgarno L (1975). "Determinant of cistron specificity in bacterial ribosomes".Nature254(5495): 34–8.PMID803646.doi:10.1038/254034a0.
  13. Kozak M (1987)."An analysis of 5'-noncoding sequences from 699 vertebrate messenger RNAs".Nucleic Acids Res.15(20): 8125–8148.PMC306349.PMID3313277.doi:10.1093/nar/15.20.8125.
  14. Bogenhagen DF, Brown DD (1981). "Nucleotide sequences in Xenopus 5S DNA required for transcription termination.".Cell24(1): 261–70.PMID6263489.doi:10.1016/0092-8674(81)90522-5.

Véxase tamén

[editar|editar a fonte]

Outros artigos

[editar|editar a fonte]

Ligazóns externas

[editar|editar a fonte]