Банк даних білків

Банк даних білків (англ. Protein Data Bank, PDB) — сховище для тривимірних структурних даних білків і нуклеїнових кислот. Ці дані, зазвичай отримані методами рентгеноструктурного аналізу і ЯМР-спектроскопії, постачаються біологами і біохіміками зі всього світу. В цій базі даних вони знаходяться у публічному домені та можуть використовуватися безкоштовно.

Історія та організація

Банк даних білків було засновано в 1971 році Едгаром Меєром і Волтером Гамільтоном, співробітниками Брукгейвенської національної лабораторії. В 1998 році, управління Банком даних було передане Дослідницькій колаборації структурної біоінформатики (англ. Research Collaboratory for Structural Bioinformatics, RCSB). Адміністрація організації знаходиться на території Університету Ратгерс, її керівником зараз є Елен Берман[1].

Міжнародна організація Всесвітній Банк даних білків (англ. Worldwide Protein Data Bank, wwPDB) складається з організацій по всьому світу, що займаються внесенням даних до бази та розповсюдженням накопиченої інформації (PDB). Членами організації зараз є RCSB PDB (США), PDBe (Європа) і PDBj (Японія). Група BMRB (США) приєдналася до wwPDB в 2006 році. Місією wwPDB є підтримка єдиного архіву даних всіх структур біологічних макромолекул та вільне розповсюдження цієї інформації.

Крім того, організацією підтримуються та приводяться до спільного формату багато інших баз даних, що містять інформацію щодо функції білків та їх еволюції.

Коли база даних була заснована, вона містила структури 7 білків. З того часу число структур швидко і майже експоненціально зростає. Сам факт цього росту став предметом окремих досліджень та аналізу growth rate.

Дані

Станом на 26 вересня 2006 року, база даних містила 39 051 тривимірних структур з атомною роздільною здатністю, з них 35 767 структур білків, решта — структури нуклеїнових кислот, нуклеопротеїнів та кількох інших молекул. Зараз щороку додається близько 5 тис. структур. Дані зберігаються в форматі mmCIF, розробленому спеціально для цієї цілі.

Проте, жодна з структур не містить точного розташування всіх атомів великих біомолекул, хоча, за винятком атомів водню, ці координати можуть бути отримані з великим ступенем достовірності. Дані про послідовності (амінокислот або нуклеотидів) не зберігаються в цій базі, ці дані зберігають в значно більших базах даних, таких як Міжнародна колаборація баз даних послідовностей (англ. International Nucleotide Sequence Database Collaboration) або Swiss-Prot.

станом на 11 вересня 2007 року, «Список даних PDB» на сайті RCSB Архівовано 4 липня 2007 у Wayback Machine. містив наступну статистику:

Білки Нуклеїнові кислоти Нуклеопротеїни Інше Всього
Рентгеноструктурний аналіз3622398316842438914
ЯМР-спектроскопія566578113476587
Електронна мікроскопія10510380153
Інші методи8044290
Всього42073177818603345744

Відмітьте, що теоретичні моделі більше не приймаються до PDB.

22461 структури в PDB мають файл структурного фактору. 3138 структури в PDB мають файл даних ЯМР. Сучасний стан бази щотижня оновлюється на сайті Архівовано 4 липня 2007 у Wayback Machine..

Формат даних

За роки існування, Формат файлів PDB пройшов через численні зміни. Оригінальний формат диктувався шириною комп'ютерних перфокарт.

  • Опис формату — складений співробітниками PDB в BNL (англ.) — тут можуть бути знайдені специфікації формати, це перший сайт, який слід відвідати перед переглядом даних.
  • PDBML (англ.) — представлення даних PDB в форматі XML.
  • ftp.rcsb.org (англ.) — Необроблені дані можуть бути скачані із цього сайту.
  • (англ.) — Файли формату PDB можуть бути отримані через HTTP з цього сайту.
  • http://www.pdb.org/pdb/files/4hhb.xml.gz (англ.) — Файли формату PDBML (XML) можуть бути отримані через HTTP з цього сайту.
  • ftp.ebi.ac.uk/pub/databases/rcsb/ (англ.) — Альтернативне розташування архіву PDB.
  • www.pdb.org (англ.) — Статистика PDB.

Застарілі формати викликають багато проблем, тому створені проєкти переводу даних:

MMDB використовує ASN.1 (та перевод цього формату в XML). Члени wwPDB — RCSB PDB, MSD-EBI і PDBj спільно працюють над створенням єдиного формату в усьому архіві. Хоча дехто сумнівається в доцільності, інші стверджують, що без цього багато даних можуть бути важкими для використання.

Кожна структура в PDB отримує чотирьохбуквений ідентифікатор, PDB ID. Ці дані не слід використовувати для ідентифікації молекули, тому що часто одна молекула має кілька структур в базі даних (отриманих за різними умовами та в різних конформаціах), які мають різні ідентифікатори.

Коли структура потрапляє до бази даних, співробітники wwPDB перевіряють та анотують її. До бази подіються тільки експериментальні, але не теоретично передбачені структури.

Зараз багато фондів, що фінансують дослідження, та наукових журналів вимагають обов'язкової подачі даних до PDB.

Використання даних

Структурні дані можуть бути візуалізовані за допомогою багатьох програм, таких як VMD, RasMol, PyMOL, Jmol, MDL Chime, QuteMol, плагінів для браузерів VRML та STING, програми для настільних комп'ютерів Sirius. Вебсайт RCSB PDB містить багато посилань на такі програми для використання для освіти, структурної геноміки та інших цілей.

Посилання

  1. Архівована копія. Архів оригіналу за 4 липня 2008. Процитовано 31 січня 2008.

Джерела

Друковані

  • H.M. Berman, K. Henrick, H. Nakamura (2003): Announcing the worldwide Protein Data Bank. Nature Structural Biology 10 (12), p. 980 PMID 14634627.
  • H.M. Berman, J. Westbrook, Z. Feng, G. Gilliland, T.N. Bhat, H. Weissig, I.N. Shindyalov, P.E. Bourne: The Protein Data Bank. Nucleic Acids Research, 28 pp. 235–242 (2000). PMID 10592235
  • Bernstein FC, Koetzle TF, Williams GJ, Meyer Jr EF, Brice MD, Rodgers JR, Kennard O, Shimanouchi T, Tasumi M. The Protein Data Bank: a computer-based archival file for macromolecular structures. J Mol Biol 1977;112:535-542. PMID 875032.
  • E.F. Meyer «The First Years of the Protein Data Bank», Protein Science 6:1591-1597 (1997)
  • Sussman, JL, Lin, D, Jiang, J, Manning, NO, Prilusky, J, Ritter, O & Abola, EE. Protein data bank (PDB): a database of 3D structural information of biological macromolecules. Acta Cryst 1998; D54:1078-1084. PMID 10089483.

Онлайн

Інші посилання

Посилання на бази даних ферментів

  • на сайті групи Кіма Гендріка (Kim Henrick) в EBI, частини MSD. ініціатива SIFTS.
  • PDB.
  • Пошук на сайті бази даних ферментів BRENDA.
  • PDBSProtEC:

Інструменти для візуалізації молекул

  • PyMOL PyMol (англ.) — головна сторінка
  • Sirius Sirius (англ.) — головна сторінка
  • STING (англ.) — головна сторінка
  • RasMol RasMol (англ.) — головна сторінка
  • Garlic (англ.) — головна сторінка
  • Swiss-PDB Viewer (англ.) — головна сторінка
  • Jmol Viewer (англ.) — головна сторінка, відкритий код, Java
  • QuteMol QuteMol Home Page (англ.) — головна сторінка, відкритий код, Windows і Mac
  • StarBiochem (англ.) — головна сторінка, Java, інтегрований пошук в PDB
This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.