Chemoinformatik

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen

Chemoinformatik,CheminformatikoderChemieinformatik(englisch:Chemoinformatics, Cheminformatics, Chemical InformaticsoderChemiinformatics) bezeichnet einen Wissenschaftszweig, der das Gebiet derChemiemit Methoden derInformatikverbindet mit dem Ziel, Methoden zur Berechnung von Moleküleigenschaften zu entwickeln und anzuwenden. Zu den Urvätern gehören unter anderemPaul deMain(1924–1999),Johann Gasteiger,Jure Zupan(* 1943) undIvar Ugi.

Der Begriff „Chemoinformatik “ist relativ jung, während die älterenTerminiComputerchemie(abgeleitet von englisch:Computational Chemistry) undchemische Graphentheoriedas gleiche Gebiet bezeichnen (Lit.:Bonchev/Rouvray, 1990).Computerchemiewird heutzutage eher als ein Teilgebiet derTheoretischen Chemieund derQuantenchemiebegriffen.

Chemoinformatik beschäftigt sich mit Berechnungen an digitalen Repräsentationen vonMolekülstrukturen.Molekülstrukturen können alsGraphenaufgefasst werden. Als ihre Repräsentation ist für viele Anwendungen bereits die sog.Bindungstabelle(englisch:connection table) ausreichend, in der die Art der Verknüpfungen (Bindungen) zwischen den einzelnenAtomeneines Moleküls abgelegt ist. Erst für weitergehende Betrachtungen kann die Einbeziehung vonzweidimensionalen(2-D-) bzw.dreidimensionalen(3-D-)Koordinatennotwendig werden. Letztere werden insbesondere benötigt, wenn, etwa im Bereich derMedizinischen Chemie,Wechselwirkungen mit Biomolekülen wieProteinenuntersucht werden sollen.

Die Größe des theoretischen chemischen Raumes aller pharmakologisch aktiven organischen Moleküle wird auf etwa 1060Moleküle geschätzt. Für diese Abschätzung wurden nur Moleküle mit den Elementen Kohlenstoff, Sauerstoff, Stickstoff und Schwefel und einermolaren Massevon unter 500 g/mol angenommen (Lit.:Bohacek, 1999). Der Raum aller denkbaren organischen Verbindung ist unendlich groß. Beide theoretischen chemischen Räume übersteigen damit bei Weitem die Menge der bisher realsynthetisiertenMoleküle (Lit.:Lahana, 1999). Mit Hilfe voncomputerbasiertenMethoden lassen sich aber unter Umständen viele MillionenMolekülebereits theoretisch (in silico) analysieren, ohne diese für reale Messungen zuerst im Labor synthetisieren zu müssen.

Repräsentation chemischer Strukturen

[Bearbeiten|Quelltext bearbeiten]

Die Repräsentation chemischer Strukturen ist eine der grundlegenden Fragestellungen. Für einen Großteil der Anwendungen hat sich die Darstellung als Bindungstabelle (Connection-Table) basierend auf derValenzstrukturtheoriedurchgesetzt. Als Beispiel einer Bindungstabelle sei hierAcesulfamim StandardformatMolfileder Firma MDL angegeben. Die Zeilen 5–14 enthalten diex-,y- undz-Koordinaten und Elementbezeichner der Atome, die Zeilen 15–24 die Bindungstabelle mit den Ausgangs- und Endatomen jeder Bindung sowie dem Bindungstyp. Die Null-Spalten enthalten mögliche weitere Bezeichner.

Acesulfame
-ISIS- 05070815372D

10 10 0 0 0 0 0 0 0 0999 V2000
3.2283 -1.4806 0.0000 S 0 0 3 0 0 0 0 0 0 0 0 0
2.5154 -1.8944 0.0000 N 0 0 0 0 0 0 0 0 0 0 0 0
3.2283 -0.6538 0.0000 O 0 0 0 0 0 0 0 0 0 0 0 0
4.0544 -1.4806 0.0000 O 0 0 0 0 0 0 0 0 0 0 0 0
3.6448 -2.1935 0.0000 O 0 0 0 0 0 0 0 0 0 0 0 0
1.7990 -1.4806 0.0000 C 0 0 0 0 0 0 0 0 0 0 0 0
2.5154 -0.2406 0.0000 C 0 0 0 0 0 0 0 0 0 0 0 0
1.7990 -0.6538 0.0000 C 0 0 0 0 0 0 0 0 0 0 0 0
1.0826 -1.8944 0.0000 O 0 0 0 0 0 0 0 0 0 0 0 0
2.5154 0.5855 0.0000 C 0 0 0 0 0 0 0 0 0 0 0 0
1 2 1 0 0 0 0
1 3 1 0 0 0 0
1 4 2 0 0 0 0
1 5 2 0 0 0 0
2 6 1 0 0 0 0
3 7 1 0 0 0 0
6 8 1 0 0 0 0
6 9 2 0 0 0 0
7 10 1 0 0 0 0
7 8 2 0 0 0 0
M END

Zusätzlich zur Bindungstabelle können 3-D-Koordinaten für real existierende Moleküle überRöntgenstrukturanalyseermittelt werden. Wo dies nicht möglich ist oder ein Molekül physisch nicht existent ist, können 3-D-Koordinaten zumindest näherungsweise auch unmittelbar aus der Bindungstabelle durchiterativeEnergie-Minimierungsrechnungenfür verschiedeneKonformationeneines Moleküls erzeugt werden. 2-D-Koordinaten dienen in der Regel allein der Veranschaulichung eines Moleküls und müssen daher hauptsächlich ästhetischen Ansprüchen genügen. Sie werden ebenfalls unmittelbar aus der Bindungstabelle nach allgemein anerkannten, chemischen Zeichenregeln errechnet, geben jedoch nur in den seltensten Fällen die tatsächlichen, räumlichen Gegebenheiten in einem Molekül wieder.

Verfahren, die keineempirischenParameter benötigen, werden als Ab-initio-Methoden bezeichnet. Semiempirische Verfahren enthalten empirische Größen und weitere semiempirische Parameter, die durch theoretische Vorgehensweisen bestimmt wurden, jedoch keinen Bezug zu messbaren Größen mehr haben. Prinzipiell sindAb-initio-Verfahren für kleinere Moleküle geeignet. Semiempirische Verfahren spielen ihre Stärke bei mittelgroßen (100 Atome) Molekülen aus. Beispiele für semiempirische Methoden sind MNDO und AM1.

Ab-initio-Methoden

[Bearbeiten|Quelltext bearbeiten]

Die Güte, mit denen Ab-initio-Verfahren die Eigenschaften von Molekülen berechnen können, hängt vom Basissatz der Atome ab, das heißt, wie gut und mit wie vielen einzelnen Funktionen die Atomorbitale dargestellt werden und in welchem Ausmaß die Elektronenkorrelation berücksichtigt wird. Ab-initio-Verfahren, die auch dieElektronenkorrelationberücksichtigen, sind deutlich aufwändiger, liefern jedoch die besten Resultate. Man behilft sich üblicherweise mit einem Kompromiss und bezieht die Elektronenkorrelation näherungsweise ein. Beispiele für solche Verfahren sind: Møller-Plesset-Störungstheorie,CI (Configuration-Interaction), CC (Coupled Cluster), MCSCF (Multi-Configuration-self-consistent-Field). Ausgangspunkt der meisten ab-initio-Verfahren ist dieHartree-Fock-Methode. Ein Vorteil der ab-initio-Verfahren ist ihre systematische Verbesserbarkeit, da man durch Vergrößerung des Basissatzes und Erhöhung des Grades der Berücksichtigung der Elektronenkorrelation (z. B. CISD, CISDT,...) die Genauigkeit der Ergebnisse systematisch verbessern kann.[1]

Dichtefunktionalmethoden

[Bearbeiten|Quelltext bearbeiten]

DieDichtefunktionaltheorie(DFT) ist ein Verfahren zur Bestimmung des Grundzustandes eines Vielelektronensystems, das auf der dreidimensionalenortsabhängigenElektronendichteberuht. Daher ist es nicht notwendig, dieSchrödingergleichungfür das vieldimensionale Mehrelelektronensystem zu lösen, wodurch sich der Aufwand anRechenleistungstark verringert bzw. Berechnungen an größeren Systemen möglich werden.[2]Grundlage der Dichtefunktionaltheorie ist dasHohenberg-Kohn-Theorem.Allerdings ist das exakte Funktional, welches die Grundzustandsdichte mit der Eigenenergie des Systems verknüpft unbekannt. In der Praxis ist daher die Wahl eines geeigneten approximiertem Funktionals für die Genauigkeit entscheidend. Die systematische Verbesserbarkeit ist weniger stark ausgeprägt als bei ab-initio-Methoden.

Semiempirische Verfahren

[Bearbeiten|Quelltext bearbeiten]

Bei semiempirischen Verfahren wird ein Großteil der Integrale des Hartree-Fock-Formalismus vernachlässigt, andere werden durch spektroskopische Werte, Parameter oder parametrisierte Funktionen angenähert. Grund für diese Approximation war die geringe Rechenkapazität früherer Zeiten. Um die theoretischen Erkenntnisse dennoch auf chemische Fragestellungen anwenden zu können, musste der vorhandene Formalismus vereinfacht werden.

DieHückel-Näherungist der einfachste semiempirische Ansatz, da sie gar keine Integrale berechnet. Allerdings ist sie auch nur auf-Elektronensysteme anwendbar. Die Theorie wurde später auch auf-Systeme erweitert (Extended-Hückel-Theory, EHT).

Etablierte Methoden, die auch heutzutage noch häufig angewendet werden, gehören zur Klasse der NDDO-Näherung (Neglect of Diatomic Differential Overlap): MNDO (Modified Neglect of Differential Overlap), AM1 (Austin-Model 1), PM3 (Parametrised Method 3). Für kritische Berechnungen sind semiempirische Methoden mit CI und MCSCF kombiniert worden. Mit solchen Verfahren sind dann beispielsweise Reaktionsbarrieren und ganze Energieprofile komplexer Reaktionen berechenbar oder sogar angeregte Zustände (MNDO/CI, MNDO/MCSCF).[3]

Die Grenzen semiempirischer Methoden liegen in ihrer Parametrisierung: Eigentlich können mit der fertigen Methoden nur Systeme gerechnet werden, die in ähnlicher Weise im Parametrisierungsdatensatz vorhanden waren.

Molekularmechanische Verfahren

[Bearbeiten|Quelltext bearbeiten]

Kraftfeldprogramme verwenden einen klassisch-mechanischen Ansatz: Bindungen zwischen zwei AtomenAundBwerden dabei einfach als Sprungfeder angenähert und im einfachsten Fall mit einem harmonischen Potenzial beschrieben (Hookesches Gesetz):

Da eine Doppelbindung zwischen zwei Kohlenstoffatomen eine andere Stärke und Gleichgewichtslänge als eine Einfachbindung besitzt, werden unterschiedliche Parametersätze benötigt (Kraftkonstanteund Ruhelage). Man verwendet daher zur Kennzeichnung der Atome keine einfachen Elemente mehr, sondern Atomtypen. Ähnliche Ansätze gibt es für Bindungs- und Torsionswinkel. Elektrostatische (Coulomb) undVan-der-Waals-Wechselwirkungenbezeichnet man als nicht-bindende Wechselwirkungen. Kraftfeldmethoden müssen an empirische oder quantenmechanisch berechnete Daten parametrisiert werden, so dass ein Kraftfeld durch zweierlei charakterisiert ist, seine Energiefunktion und den Parametersatz.

Kraftfelder ermöglichen die Geometrieoptimierung sehr großer (Bio-)Moleküle (zum Beispiel:Proteine) und werden hauptsächlich fürMoleküldynamik-oderMonte-Carlo-Simulationenverwendet.

Es gibt verschiedene wichtige Themen innerhalb des Gebiets – eine Auswahl:

  • Die computergestützte Darstellung von Molekülen und die quantenmechanische Berechnung ihrer Eigenschaften.
  • Anwendungen, die Chemikalien strukturiert speichern und finden können (Datenbanken)
  • Methoden, um die Systematiken in der Wechselwirkung zwischen Molekularstruktur und Eigenschaften der Stoffe zu verstehen (QSPR).
  • Kraftfeldrechnungen zur Geometrieoptimierung großer Moleküle
  • Moleküldynamikzur Berechnung von Bindungsthermodynamik der Enzyme
  • Computergestützte Syntheseplanung
  • Computergestützte Prognose der Wirksamkeit von Arzneimitteln

Im Folgenden werden ausgewählte Anwendungsbeispiele genauer dargestellt.

Quantitative Struktur-Wirkungs-Beziehung

[Bearbeiten|Quelltext bearbeiten]

Mithilfe geeigneterAlgorithmenwerdenKodierungenfür Moleküle entwickelt. DurchInduktionkönnen neueHypothesenüber molekulare Eigenschaften erstellt werden, wie zum Beispiel dieBioverfügbarkeitoder die Fähigkeit einer Substanz, die Funktion eines bestimmtenProteinsimOrganismuszu hemmen oder zu verstärken (siehe auch:QSAR).

Leitstrukturoptimierung

[Bearbeiten|Quelltext bearbeiten]

Durch geeignete chemische undbiologischeHypothesenlässt sich dieser chemische Raum auf wenige Kandidaten reduzieren, die dann imLaborsynthetisiert und klinisch getestet werden. Aus diesem Grund spielt die Cheminformatik im Bereich derpharmazeutischen Chemieund derMedizinalchemieeine große Rolle zur Optimierung vonLeitstrukturen.

In dertechnischen ChemiewerdenGruppenbeitragsmethodenverwendet, um Stoffeigenschaften wieNormalsiedepunkte,kritische Daten,Oberflächenspannungenund anderes mehr abzuschätzen.

Molekulare Modellierung

[Bearbeiten|Quelltext bearbeiten]

DieMolekulare Modellierungbeschäftigt sich beispielsweise mit der Schaffung von Modellen unbekannter Makromoleküle anhand der Vorlage (Template) ähnlicher, bekannter Moleküle (Homologiemodeling), der Wechselwirkung zwischen kleinen und großen Molekülen (Rezeptordocking), wodurchQSARmöglich wird, der Moleküldynamik sowie die Entwicklung energetisch minimierter 3-D-Strukturen von Molekülen (Bergsteigeralgorithmus,Simulierte Abkühlung,Molekülmechaniketc.). Es geht also darum, aufgrund bekannter Strukturen Modelle von unbekannten Strukturen zu entwickeln, um so eine QSAR zu ermöglichen.

Verwandte Gebiete

[Bearbeiten|Quelltext bearbeiten]

Es gibt einen starken Bezug zurAnalytischen Chemieund zurChemometrie.Die Struktur-Eigenschafts-Beziehungen (beispielsweise: Spektrenkorrelation) spielen eine zentrale Rolle. Aufgrund vergleichbarer Arbeitsweise existiert eine enge Beziehung zurComputerphysik,wodurch eine klare Trennung häufig nicht eindeutig gegeben ist.

Die Programme der Computerchemie basieren auf verschiedenen quantenchemischen Methoden zur Lösung der molekularenSchrödingergleichung.Grundsätzlich lassen sich zwei Ansätze unterscheiden: Semiempirische Verfahren und Ab-initio-Verfahren.

Alle beschriebenen Verfahren und Methoden sind in gängigen Softwarepaketen verfügbar. Beispiele hierfür: ACES,GAUSSIAN,GAMESS,MOLPRO, Spartan, TURBOMOLE, Cerius2 und Jaguar. ArgusLab eignet sich als frei verfügbares Programm zum Einstieg in der Computerchemie.

Die Herausforderung für den Anwender dieser Software ist es, das am besten geeignete Modell für seine Problemstellung zu finden und die Ergebnisse im Gültigkeitsbereich der Modelle zu interpretieren.

  1. Trygve Helgaker, Jeppe Olsen, Poul Jorgensen:Molecular Electronic-Structure Theory.Reprint Auflage. Wiley-Blackwell, Chichester 2013,ISBN 978-1-118-53147-1(amazon.de[abgerufen am 19. Dezember 2018]).
  2. Wolfram Koch, Max C. Holthausen:A Chemist's Guide to Density Functional Theory.John Wiley & Sons, 2015,ISBN 978-3-527-80281-4.
  3. Walter Thiel:Semiempirical quantum–chemical methods.In:Wiley Interdisciplinary Reviews: Computational Molecular Science.Band4,Nr.2,2014,ISSN1759-0884,S.145–157,doi:10.1002/wcms.1161.