Pfam

Pfam
Content
Description	Baza de date Pfam oferă aliniamente și modele Markov ascunse pentru domenii de proteine.
Data types; captured	Familii de proteine
Organisms	toate
Contact
Research center	EBI
Primary citation	PubMed
Access
Data format	Stockholm format
Website	pfam.xfam.org
Download URL	FTP 1FTP 2
Miscellaneous
License	GNU Lesser General Public License
Version	33.1
Bookmarkable; entities	yes

Pentru uniunea muncii din fotbalul din Malaezia care a folosit acronimul PFAM, vedețiAsociația Fotbaliștilor Profesioniști din Malaezia.

Pfameste o bază de date aproteinecare include adnotările șialinierea secvențelor multiplegenerate utilizândmodelul Markov ascuns.^[1]^[2]^[3]Cea mai recentă versiune, Pfam 33.1, a fost lansată în mai 2020 și conține 18.259 de familii.^[4]

Utilizări

Scopul general al bazei de date Pfam este de a oferi o clasificare completă și precisă a familiilor și domeniilor de proteine.^[5]Inițial, raționamentul din spatele creării bazei de date a fost de a avea o metodă semiautomată de curățare a informațiilor privind familiile de proteine cunoscute pentru a îmbunătăți eficiența adnotării genomurilor.^[6]Clasificarea Pfam a familiilor de proteine a fost adoptată pe scară largă de biologi datorită acoperirii largi a proteine și convenții de denumire sensibile.^[7]

Acesta este utilizată de biologii experimentali care cercetează proteine specifice, de biologii structurali pentru a identifica noi obiective pentru determinarea structurii, de biologii computaționali pentru a organiza secvențe și de biologii evoluționiști care urmăresc originile proteinelor.^[8]Proiectele genomului timpuriu, ar fi umane și utilizate pe scară largă de Pfam pentru adnotarea funcțională a datelor genomice.^[9]^[10]^[11]

Site-ul Pfam permite utilizatorilor să prezinte secvențe de proteine sau ADN pentru a căuta potriviri familiilor din baza de date. Dacă ADN-ul este prezentat, se efectuează un cadru cu șase cadretranstrație,apoi fiecare cadru este căutat.^[12]În loc să efectueze o căutare tipicăBLAST,Pfam folosește profilulmodelele Markov ascunse,care acordă o greutate mai mare potrivirilor laconservatăsite-uri, permițând o mai bună detectare a homologiei de la distanță, făcându-le mai potrivite pentru adnotarea genomurilor organismelor fără rude apropiate bine adnotate.^[13]

Pfam a fost, de asemenea, utilizat în crearea altor resurse, cum ar fiiPfam,care cataloghează interacțiunile domeniu-domeniu în interiorul și între proteine, pe baza informațiilor din bazele de date de structură și cartografierea domeniilor Pfam pe aceste structuri.^[14]

Caracteristici

Pentru fiecare familie din Pfam se poate:

Vedea o descriere a familiei
Verificarea mai multor aliniamente
Vedea arhitecturi de domeniu de proteine
Examinarea distribuției speciilor
Urmați link-uri către alte baze de date
Vedea structurile cunoscute de proteine

Intrările pot fi de mai multe tipuri: familie, domeniu, repetări sau motive. Familia este clasa implicită, ceea ce indică pur și simplu că membrii sunt înrudiți. Domeniile sunt definite ca o unitate structurală autonomă sau o unitate secvențială reutilizabilă care poate fi găsită în mai multe contexte proteice. Repetările nu sunt de obicei stabile în mod izolat, ci mai degrabă sunt de obicei necesare pentru a forma repetă tandem în scopul de a forma un domeniu sau o structură extinsă. Motivele sunt, de obicei, unități de secvență mai scurte găsite în afara domeniilor globulare.^[9]

Descrierile familiilor Pfam sunt gestionate de publicul larg folosind Wikipedia (a se vedeaIstoric).

La eliberarea variantei 29.0, 76.1% din secvențele de proteine înUniprotKBs-a potrivit cu cel puțin un domeniu Pfam.^[15]

Referințe

^Finn RD, Tate J, Mistry J, Coggill PC, Sammut SJ, Hotz HR, Ceric G, Forslund K, Eddy SR, Sonnhammer EL, Bateman A (2008).„The Pfam protein families database”.Nucleic Acids Res.36(Database issue): D281–8.doi:10.1093/nar/gkm960.PMC2238907 .PMID 18039703.
^Finn, R. D.; Mistry, J.; Schuster-Böckler, B.; Griffiths-Jones, S.; Hollich, V.; Lassmann, T.; Moxon, S.; Marshall, M.; Khanna, A.; Durbin, R.; Eddy, S. R.; Sonnhammer, E. L.; Bateman, A. (2006).„Pfam: clans, web tools and services”(Free full text).Nucleic Acids Research.34(Database issue): D247–D251.doi:10.1093/nar/gkj149.ISSN 0305-1048.PMC1347511 .PMID 16381856.
^Bateman, A.;Coin, L.;Durbin, R.;Finn, R. D.; Hollich, V.; Griffiths-Jones, S.; Khanna, A.; Marshall, M.; Moxon, S.; Sonnhammer, E. L.; Studholme, D. J.; Yeats, C.;Eddy, S. R.(2004).„The Pfam protein families database”.Nucleic Acids Research.32(Database issue): 138D–1141.doi:10.1093/nar/gkh121.ISSN 0305-1048.PMC308855 .PMID 14681378.
^Finn, Rob; Mistry, Jaina (8 martie 2017).„Pfam 31.0 is released”.Xfam Blog.Accesat în13 martie 2017.
^Sammut, Stephen; Finn, Robert D.; Bateman, Alex (2008). „Pfam 10 years on: 10 000 families and still growing”.Briefings in Bioinformatics.9(3): 210–219.doi:10.1093/bib/bbn010 .PMID 18344544.
^Sonnhammer, Erik L.L.; Eddy, Sean R.; Durbin, Richard (1997). „Pfam: A Comprehensive Database of Protein Domain Families Based on Seed Alignments”.Proteins.28(3): 405–420.doi:10.1002/(sici)1097-0134(199707)28:3<405::aid-prot10>3.0.co;2-l.PMID 9223186.
^Xu, Qifang; Dunbrack, Roland L. (2012).„Assignment of protein sequences to existing domain and family classification systems: Pfam and the PDB”.Bioinformatics.28(21): 2763–2772.doi:10.1093/bioinformatics/bts533.PMC3476341 .PMID 22942020.
^Finn, R. D.; Mistry, J.; Tate, J.; Coggill, P.; Heger, A.; Pollington, J. E.; Gavin, O. L.; Gunasekaran, P.; Ceric, G.; Forslund, K.; Holm, L.; Sonnhammer, E. L. L.; Eddy, S. R.; Bateman, A. (2009).„The Pfam protein families database”.Nucleic Acids Research.38(Database): D211–D222.doi:10.1093/nar/gkp985.ISSN 0305-1048.PMC2808889 .PMID 19920124.
^^a ^bBateman A, Birney E, Cerruti L, Durbin R, Etwiller L, Eddy SR, Griffiths-Jones S, Howe KL, Marshall M, Sonnhammer EL (2002).„The Pfam protein families database”.Nucleic Acids Res.30(1): 276–80.doi:10.1093/nar/30.1.276.PMC99071 .PMID 11752314.
^Adams MD, Celniker SE, Holt RA, Evans CA, Gocayne JD, et al. (2000). „The genome sequence of Drosophila melanogaster”.Science.287(5461): 2185–95.Bibcode:2000Sci...287.2185..CiteSeerX10.1.1.549.8639 .doi:10.1126/science.287.5461.2185.PMID 10731132.
^Lander, Eric S.; Linton, Lauren M.; Birren, Bruce; Nusbaum, Chad; Zody, Michael C.; et al. (2001). „Initial sequencing and analysis of the human genome”.Nature.409(6822): 860–921.doi:10.1038/35057062 .ISSN 0028-0836.PMID 11237011.
^Finn, Robert D.; Bateman, Alex; Clements, Jody; Coggill, Penelope; Eberhardt, Ruth Y.; Eddy, Sean R.; Heger, Andreas; Hetherington, Kirstie; Holm, Liisa; Mistry, Jaina; Sonnhammer, Erik L. L.; Tate, John; Punta, Marco (2014).„Pfam: the protein families database”.Nucleic Acids Research.42(D1): D222–D230.doi:10.1093/nar/gkt1223.ISSN 0305-1048.PMC3965110 .PMID 24288371.
^Sonnhammer EL, Eddy SR, Birney E, Bateman A, Durbin R (1998).„Pfam: multiple sequence alignments and HMM-profiles of protein domains”.Nucleic Acids Res.26(1): 320–2.doi:10.1093/nar/26.1.320.PMC147209 .PMID 9399864.
^Finn, R. D.; Marshall, M.; Bateman, A. (2004). „iPfam: visualization of protein-protein interactions in PDB at domain and amino acid resolutions”.Bioinformatics.21(3): 410–412.doi:10.1093/bioinformatics/bti011 .ISSN 1367-4803.PMID 15353450.
^Finn, Robert D.; Coggill, Penelope; Eberhardt, Ruth Y.; Eddy, Sean R.; Mistry, Jaina; Mitchell, Alex L.; Potter, Simon C.; Punta, Marco; Qureshi, Matloob; Sangrador-Vegas, Amaia; Salazar, Gustavo A.; Tate, John; Bateman, Alex (2016).„The Pfam protein families database: towards a more sustainable future”.Nucleic Acids Research.44(D1): D279–D285.doi:10.1093/nar/gkv1344.ISSN 0305-1048.PMC4702930 .PMID 26673716.

Legături externe

Pfam- Baza de date a familiei proteice laEBIMarea Britanie
iPfam Arhivatîn7 ianuarie 2011,laWayback Machine.- Interacțiuni de domenii Pfam în PDB
PDBfam- Misiuni de domenii Pfam la secvențe în PDB laFox Chase Cancer CenterStatele Unite ale Americii
PlantTFDB Arhivatîn14 februarie 2020,laWayback Machine.- Regulile de atribuire a familiei pentru factorii de transcriere a plantelor pe baza domeniilor Pfam

[pmid18039703-1] Finn RD, Tate J, Mistry J, Coggill PC, Sammut SJ, Hotz HR, Ceric G, Forslund K, Eddy SR, Sonnhammer EL, Bateman A (2008).„The Pfam protein families database”.Nucleic Acids Res.36(Database issue): D281–8.doi:10.1093/nar/gkm960.PMC2238907 .PMID 18039703.

[pmid16381856-2] Finn, R. D.; Mistry, J.; Schuster-Böckler, B.; Griffiths-Jones, S.; Hollich, V.; Lassmann, T.; Moxon, S.; Marshall, M.; Khanna, A.; Durbin, R.; Eddy, S. R.; Sonnhammer, E. L.; Bateman, A. (2006).„Pfam: clans, web tools and services”(Free full text).Nucleic Acids Research.34(Database issue): D247–D251.doi:10.1093/nar/gkj149.ISSN 0305-1048.PMC1347511 .PMID 16381856.

[pmid14681378-3] Bateman, A.;Coin, L.;Durbin, R.;Finn, R. D.; Hollich, V.; Griffiths-Jones, S.; Khanna, A.; Marshall, M.; Moxon, S.; Sonnhammer, E. L.; Studholme, D. J.; Yeats, C.;Eddy, S. R.(2004).„The Pfam protein families database”.Nucleic Acids Research.32(Database issue): 138D–1141.doi:10.1093/nar/gkh121.ISSN 0305-1048.PMC308855 .PMID 14681378.

[Pfamrelnotes-4] Finn, Rob; Mistry, Jaina (8 martie 2017).„Pfam 31.0 is released”.Xfam Blog.Accesat în13 martie 2017.

[Sammut2008-5] Sammut, Stephen; Finn, Robert D.; Bateman, Alex (2008). „Pfam 10 years on: 10 000 families and still growing”.Briefings in Bioinformatics.9(3): 210–219.doi:10.1093/bib/bbn010 .PMID 18344544.

[Sonnhammer1997-6] Sonnhammer, Erik L.L.; Eddy, Sean R.; Durbin, Richard (1997). „Pfam: A Comprehensive Database of Protein Domain Families Based on Seed Alignments”.Proteins.28(3): 405–420.doi:10.1002/(sici)1097-0134(199707)28:3<405::aid-prot10>3.0.co;2-l.PMID 9223186.

[Xu2012-7] Xu, Qifang; Dunbrack, Roland L. (2012).„Assignment of protein sequences to existing domain and family classification systems: Pfam and the PDB”.Bioinformatics.28(21): 2763–2772.doi:10.1093/bioinformatics/bts533.PMC3476341 .PMID 22942020.

[FinnMistry2009-8] Finn, R. D.; Mistry, J.; Tate, J.; Coggill, P.; Heger, A.; Pollington, J. E.; Gavin, O. L.; Gunasekaran, P.; Ceric, G.; Forslund, K.; Holm, L.; Sonnhammer, E. L. L.; Eddy, S. R.; Bateman, A. (2009).„The Pfam protein families database”.Nucleic Acids Research.38(Database): D211–D222.doi:10.1093/nar/gkp985.ISSN 0305-1048.PMC2808889 .PMID 19920124.

[Bateman2002-9] Bateman A, Birney E, Cerruti L, Durbin R, Etwiller L, Eddy SR, Griffiths-Jones S, Howe KL, Marshall M, Sonnhammer EL (2002).„The Pfam protein families database”.Nucleic Acids Res.30(1): 276–80.doi:10.1093/nar/30.1.276.PMC99071 .PMID 11752314.

[10] Adams MD, Celniker SE, Holt RA, Evans CA, Gocayne JD, et al. (2000). „The genome sequence of Drosophila melanogaster”.Science.287(5461): 2185–95.Bibcode:2000Sci...287.2185..CiteSeerX10.1.1.549.8639 .doi:10.1126/science.287.5461.2185.PMID 10731132.

[LanderLinton2001-11] Lander, Eric S.; Linton, Lauren M.; Birren, Bruce; Nusbaum, Chad; Zody, Michael C.; et al. (2001). „Initial sequencing and analysis of the human genome”.Nature.409(6822): 860–921.doi:10.1038/35057062 .ISSN 0028-0836.PMID 11237011.

[FinnBateman2014-12] Finn, Robert D.; Bateman, Alex; Clements, Jody; Coggill, Penelope; Eberhardt, Ruth Y.; Eddy, Sean R.; Heger, Andreas; Hetherington, Kirstie; Holm, Liisa; Mistry, Jaina; Sonnhammer, Erik L. L.; Tate, John; Punta, Marco (2014).„Pfam: the protein families database”.Nucleic Acids Research.42(D1): D222–D230.doi:10.1093/nar/gkt1223.ISSN 0305-1048.PMC3965110 .PMID 24288371.

[Sonnhammer1998-13] Sonnhammer EL, Eddy SR, Birney E, Bateman A, Durbin R (1998).„Pfam: multiple sequence alignments and HMM-profiles of protein domains”.Nucleic Acids Res.26(1): 320–2.doi:10.1093/nar/26.1.320.PMC147209 .PMID 9399864.

[FinnMarshall2004-14] Finn, R. D.; Marshall, M.; Bateman, A. (2004). „iPfam: visualization of protein-protein interactions in PDB at domain and amino acid resolutions”.Bioinformatics.21(3): 410–412.doi:10.1093/bioinformatics/bti011 .ISSN 1367-4803.PMID 15353450.

[FinnCoggill2016-15] Finn, Robert D.; Coggill, Penelope; Eberhardt, Ruth Y.; Eddy, Sean R.; Mistry, Jaina; Mitchell, Alex L.; Potter, Simon C.; Punta, Marco; Qureshi, Matloob; Sangrador-Vegas, Amaia; Salazar, Gustavo A.; Tate, John; Bateman, Alex (2016).„The Pfam protein families database: towards a more sustainable future”.Nucleic Acids Research.44(D1): D279–D285.doi:10.1093/nar/gkv1344.ISSN 0305-1048.PMC4702930 .PMID 26673716.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]