Saltar ao contido

Contido GC

Na Galipedia, a Wikipedia en galego.
Enlaces por pontes de hidróxeno (frechas) entre as bases AT e GC.

Enbioloxía molecularexenética,ocontido GC,contido guanina-citosina,porcentaxe GCoucontido G+C(ás vecesrazón GC) é a porcentaxe debases nitroxenadasdunha molécula deADNque songuaninaoucitosinade entre o total das catro baes posibles (adenina,timina,guanina e citosina). O contido GC pode referirse a un determinado fragmento de ADN, a uncromosomacompleto ou a unxenomaenteiro. Pode aplicarse tamén ao ARN (que teríauraciloen vez de timina). Cando se refire a un fragmento do material xenético este pode ser unha parte dun xene (dominio), un só xene completo, un grupo de xenes (oucluster), ou mesmo a unha rexión non codificante.

Nas medicións en xenomas bacterianos o normal é expresalo en %mol.

A guanina (G) e a citosina (C) emparéllanse no ADN formando 3enlaces de hidróxeno,mentres que a timina (T) e a adenina (A) únense entre si por medio de dous destes enlaces. O ADN cun alto contido GC é máis estable que o de contido baixo porque forman máis pontes de hidróxeno, aínda que o que máis inflúe na estabilización do ADN son as interaccións entre as bases amoreadas.[1] A pesar da alta termoestabilidade que un alto contido GC lle dá ao material xenético, as células con alto contido GC de bacterias sofrenautólise,reducindo dese modo a lonxevidade da célula.[2]Debido á robustez que lle dá ao material xenético ter un alto contido GC, críase tradicionalmente que un ADN cun contido GC elevado era unha adaptación importante ás altas temperaturas no medio, pero esta hipótese foi posta en dúbida recentemente nun estudo comparativo entre procariotas.[3] Porén, o mesmo estudo mostrou unha forte relación entre as temperaturas altas e o contido GC alto dosARNsestruturados (como oARN ribosómico,oARN transferente,e moitos outrosARN non codificantes). Nos ARN os pares de bases GC son máis estables que os AU, debido a que forman un enlace e hidróxeno máis, e isto fai que as estruturas con ARN (que forman enlaces intracatenarios) sexan máis tolerantes ás altas temperaturas. Máis recentemente, a primeira análise xenómica a grande escala demostrou a correlación entre o contido GC e a temperatura para certas rexións xenómicas (as codificantes) pero non para outras.[4]

Nos experimentos dePCR,o contido GC doscebadoresutilízase para predicir a temperatura deannealingco ADN molde. Un maior contido GC indica unha maiortemperatura de fusión.

Determinación do contido GC

[editar|editar a fonte]

O contido GC exprésase xeralmente como unha porcentaxe do contido en bases G e C no total de bases. A porcentaxe GC calcúlase coa seguinte fórmula:[5]

Outra forma distinta de medir a cantidade de G e C, que non se debe confundir coa anterior, é por medio darazón AT/GC,que é a razón entre o contido en G e C con respecto ao contido en A e T. A razón AT/GC calcúlase así:[6]

.

O contido GC pode medirse de diversas maneiras, pero un dos métodos máis simples é medir atemperatura de fusión do ADNde dobre cadea utilizandoespectrofotometría.AabsorbanciadoADNálonxitude de ondade 260nmincreméntase moito cando se separan as cadeas dadobre hélicedo ADN ao ser quentadas.[7]Pode utilizarse tamén para a determinación acitometría de fluxopara grandes cantidades de mostras.[8]

De forma alternativa, se a molécula de ADN ou ARN estudada foisecuenciadaentón o contido GC pode ser calculado con precisión por simple aritmética ou usando acalculadora GC en liña.

Contido GC e xenes

[editar|editar a fonte]

Os contidos GC entre rexións dun xenoma son moi variables. Estas variacións nos xenomas dos organismos máis complexos dan lugar a unha formación de tipo mosaico con rexións illa chamadasisocoros.[9]Isto dá lugar a variacións na intensidade de tinguidura doscromosomas.[10]Os isocoros ricos en GC inclúen moitos xenes que codifican proteínas, e deste modo a determinación do contido GC desas rexións específicas contribúe a mapar as rexións ricas en xenes do xenoma.[11][12]

Por tanto, os xenes caracterízanse por ter un alto contido GC en comparación co contido GC de fondo de todo o xenoma. A lonxitude da secuencia codificante é directamente proporcional ao contido GC.[13][14]

Contido GC e filoxenia

[editar|editar a fonte]

O contido GC é moi variable entre os distintos organismos. O contido GC alto pode ter que ver co nesgo nareparación do ADNasociada árecombinación,que incrementa o contido GC, o que inflúe na evolución dos organismos.[15]O problema de determinar o límite das especies na taxonomía dos procariotas levou a que se fixesen diversas recomendacións para a clasificación dos procariotas, como a doComité ad hoc sobre a reconciliación dos enfoques en sistemática bacteriana,que recomenda utilizar o contido GC para a clasificación dos niveis taxonómicos superiores.[16]Por exemplo, asActinobacteriacaracterízanse polo seu alto contido GC[17](enStreptomyces coelicolorA3(2), o contido GC é 72%).[18]O contido GC dolévedo(Saccharomyces cerevisiae) é de 38%,[19]e o doutroorganismo modelocomún como a plantaArabidopsis thalianaé de 36%.[20]

Debido á natureza docódigo xenético(con codóns que utilizan todas as bases) é virtualmente imposible que un organismo teña un xenoma cun contido GC próximo a 0% ou 100%, por iso son raros os casos de especies cun contido GC extraordinariamente baixo comoPlasmodium falciparum(GC% = ~20%),[21]que é un organismo rico en AT ou pobre en GC.[22]

Especie Grupo filoxenético Contido GC
Streptomyces coelicolor
Myxococcus xanthus
Halobacteriumsp.
Saccharomyces cerevisiae(lévedo)
Arabidopsis thaliana
Methanosphaera stadtmanae
Plasmodium falciparum(axente damalaria)
Actinobacteria
Deltaproteobacteria
Arquea
Ascomiceto (fungo)
Planta con flor
Arquea
Protozoo
72 %
68 %
67 %
38 %
36 %
27 %
≈20 %
  1. Yakovchuk P, Protozanova E, Frank-Kamenetskii MD (2006)."Base-stacking and base-pairing contributions into thermal stability of the DNA double helix".Nucleic Acids Res.34(2): 564–74.PMC1360284.PMID16449200.doi:10.1093/nar/gkj454.
  2. Levin RE, Van Sickle C (1976). "Autolysis of high-GC isolates of Pseudomonas putrefaciens".Antonie Van Leeuwenhoek42(1–2): 145–55.PMID7999.doi:10.1007/BF00399459.
  3. Hurst LD, Merchant AR (2001)."High guanine-cytosine content is not an adaptation to high temperature: a comparative analysis amongst prokaryotes".Proc. Biol. Sci.268(1466): 493–7.PMC1088632.PMID11296861.doi:10.1098/rspb.2000.1397.
  4. Zheng H, Wu H (2010)."Gene-centric association analysis for the correlation between the guanine-cytosine content levels and temperature range conditions of prokaryotic species".BMC Bioinformatics11:S7.PMC3024870.PMID21172057.doi:10.1186/1471-2105-11-S11-S7.
  5. Madigan,MT. and Martinko JM. (2003).Brock biology of microorganisms(10th ed.). Pearson-Prentice Hall.ISBN84-205-3679-2.
  6. "Definition of GC-ratio on Northwestern University, IL, USA".Arquivado dendeo orixinalo 20 de xuño de 2010.Consultado o 17 de xullo de 2013.
  7. Wilhelm J, Pingoud A, Hahn M (2003)."Real-time PCR-based method for the estimation of genome sizes".Nucleic Acids Res.31(10): e56.PMC156059.PMID12736322.doi:10.1093/nar/gng056.
  8. Vinogradov AE (1994). "Measurement by flow cytometry of genomic AT/GC ratio and genome size".Cytometry16(1): 34–40.PMID7518377.doi:10.1002/cyto.990160106.
  9. Bernardi G (2000)."Isochores and the evolutionary genomics of vertebrates".Gene241(1): 3–17.PMID10607893.doi:10.1016/S0378-1119(99)00485-0.
  10. Furey TS, Haussler D (2003)."Integration of the cytogenetic map with the draft human genome sequence".Hum. Mol. Genet.12(9): 1037–44.PMID12700172.doi:10.1093/hmg/ddg113.
  11. Sumner AT, de la Torre J, Stuppia L (1993)."The distribution of genes on chromosomes: a cytological approach".J. Mol. Evol.37(2): 117–22.PMID8411200.doi:10.1007/BF02407346.
  12. Aïssani B, Bernardi G (1991)."CpG islands, genes and isochores in the genomes of vertebrates".Gene106(2): 185–95.PMID1937049.doi:10.1016/0378-1119(91)90198-K.
  13. Pozzoli U, Menozzi G, Fumagalli M; et al. (2008)."Both selective and neutral processes drive GC content evolution in the human genome".BMC Evol. Biol.8:99.PMC2292697.PMID18371205.doi:10.1186/1471-2148-8-99.
  14. Wuitschick JD, Karrer KM (1999). "Analysis of genomic G + C content, codon usage, initiator codon context and translation termination sites inTetrahymena thermophila".J. Eukaryot. Microbiol.46(3): 239–47.PMID10377985.doi:10.1111/j.1550-7408.1999.tb05120.x.
  15. Birdsell JA (1 July 2002)."Integrating genomics, bioinformatics, and classical genetics to study the effects of recombination on genome evolution".Mol. Biol. Evol.19(7): 1181–97.PMID12082137.
  16. Wayne LG; et al. (1987). "Report of the ad hoc committee on reconciliation of approaches to bacterial systematic".International journal of systematic bacteriology37(4): 463–4.doi:10.1099/00207713-37-4-463.
  17. Taxonomy browser on NCBI
  18. Whole genome data of "Streptomyces coelicolor" A3(2) on NCBI
  19. Whole genome data ofSaccharomyces cerevisiaeon NCBI
  20. Whole genome data ofArabidopsis thalianaon NCBI
  21. Whole genome data ofPlasmodium falciparumon NCBI
  22. Musto H, Cacciò S, Rodríguez-Maseda H, Bernardi G (1997)."Compositional constraints in the extremely GC-poor genome ofPlasmodium falciparum"(PDF).Mem. Inst. Oswaldo Cruz92(6): 835–41.PMID9566216.doi:10.1590/S0074-02761997000600020.

Véxase tamén

[editar|editar a fonte]

Ligazóns externas

[editar|editar a fonte]
  1. Table with GC-content of all sequenced prokaryotes
  2. Taxonomic browser of bacteria based on GC ratio on NCBI website.
  3. GC ratio in diverse species.