28.10.2021 22:20 - Über uns - Mediadaten - Impressum & Kontakt - succidia AG
Forscher > Prof. Dr. Jürgen Bajorath > Neue Visualisierungskonzepte für die medizinische Chemie

Neue Visualisierungskonzepte für die medizinische Chemie

Wanderungen durch Aktivitätslandschaften

Massives Wachstum biologischer und chemischer Daten unterstützt wissensbasierte ­Arbeitsweisen in der Pharmaforschung, stellt allerdings auch hohe Anforderungen an ­Datenanalytik und experimentelles Design. Das betrifft auch die medizinische Chemie. ­Konventionelle Ansätze für die Analyse von Strukturfunktionsbeziehungen niedermole­-kularer Verbindungen (Structure-Activity Relationship; SAR) sind nicht mehr ausreichend, um stetig wachsende Datenmengen (Moleküle und deren In-vitro-Aktivitäten) auszuwerten und ­experimentell überprüfbare Hypothesen zu generieren. In den letzten Jahren sind neue ­computergestützte Methoden für die systematische SAR-Analyse großer Datensätze entwickelt worden, die einen besonderen Schwerpunkt auf Visualisierung setzen, um komplexe SAR-Muster intuitiv erfassbar zu machen und die Identifizierung von Schlüsselverbindungen zu unterstützen.

Subjektive Kriterien in der Chemie

Chemiker werden überwiegend mithilfe zweidimensionaler molekularer Repräsentationen ausgebildet (so genannte molekulare Graphen). In der medizinischen Chemie spielt die Analyse von SARs eine zentrale Rolle im Rahmen der chemischen Opti­mierung von Leitstrukturen. Die SAR-Analyse wird traditionell auf der Basis molekularer Graphen durchgeführt. Dabei werden SAR-Daten in Substituenten-Tabellen (R-Group Table; RGT) organisiert, die die Kernstruktur einer Verbindungsreihe, alle vorkommenden Substituenten und die biologischen Aktivitäten der korrespondierenden Moleküle auflisten. Diese RGTs sind bis heute ein konventionelles Rüstzeug des medizinischen Chemikers. Traditionell konzentriert sich die chemische Optimierung auf individuelle Verbindungsreihen. Man arbeitet an einer ­be­stimmten Kernstruktur, stellt analoge Verbindungen mit unterschiedlichen Substituenten her, bestimmt deren biologische Aktivität und registriert die Ergebnisse in RGTs. Falls der Fortschritt mit einer Verbindungsreihe in der Leitstrukturoptimierung nicht ausreichend ist, wird eine andere ­Serie bearbeitet. Dabei wird natürlich nicht nur die primäre Wirksamkeit eines Moleküls erhöht, sondern es müssen mehrere optimierungsrelevante Parameter ins Kalkül gezogen werden (z.B. Löslichkeit oder metabolische Stabilität). RGTs sind eine sinnvolle Datenstruktur, solange man an individuellen Verbindungsreihen arbeitet und die Zahl der Analoge begrenzt ist. So ist es kaum möglich, hunderte von Analogen unterschiedlicher Serien mit dem Auge des Chemikers einer sub­jektiven Analyse zu unterziehen und SAR-Regeln abzuleiten, die zu einer sinnvollen Optimierung führen. Hier stoßen wir rasch an unsere Grenzen. Dennoch spielen subjektive Kriterien, chemische Intuition und individuelle Erfahrung eine Schlüsselrolle in der medizinischen Chemie – und der Erfolg gibt chemischem Scharfsinn oft Recht. Wir wissen aber auch, dass selbst erfahrene medizinische Chemiker selten in ihrer ­Ana­lyse übereinstimmen, welche Moleküle bevor­zugte Leitstrukturen oder Medikamentkandidaten darstellen [1]. Zusätzlich ist unsere Perzeption chemischer Strukturen und Eigenschaften kontextabhängig. So hängen unsere Schlussfolgerungen typischerweise von der Reihenfolge ab, in der uns Moleküle präsentiert werden [1]. Trotz der vielen Erfolge subjektiver Analyse und chemischer Intuition ist in der medizinischen Chemie noch viel Raum für „objektive“ Datenanalytik und wissensbasiertes molekulares Design.

Datenflut

In den letzten Jahren erleben wir ein fast exponentielles Wachstum von SAR-Daten und ein Ende ist nicht in Sicht. Diese Datenflut führt nicht nur zu einer noch nie da gewesenen Wissensbasis, die allerdings erst einmal erschlossen werden muss, sondern erschwert auch traditionelle Arbeitsweisen in der medizinischen Chemie. SAR-Daten nehmen innerhalb der Pharmaindustrie und auch im öffentlichen Sektor mit großer Geschwindigkeit zu. So sind in großen öffentlichen Datenbanken wie ChEMBL [2] oder PubChem [3] zurzeit bereits mehr als 10 Mio. aktive Moleküle verfügbar, die zu einem großen Teil mit mehreren Zielpro­teinen assoziiert sind. Für attraktive therapeutische Zielproteine sind in aller Regel bereits viele Verbindungsreihen mit oft sehr unterschiedlichem SAR-Informationsgehalt vorhanden. Zusätzlich zu den großen Datenvolumen erschwert die Heterogenität der SAR- Informationen eine sinnvolle und erfolgversprechende Auswertung und Umsetzung in zunehmend wirksamere Kandidatenmoleküle. Lernen von großen Mengen heterogener SAR-Daten ist in der Tat zu einer großen Herausforderung in der medizinischen Chemie geworden.

Computergestützte Analyse und Aktivitätsvorhersagen

Neue Anforderungen an die Datenanalyse gehen ganz eindeutig über die Kapazität subjektiver Vorgehensweisen mithilfe von RGTs hinaus. Sollte man deshalb nicht ­erwarten, dass Computermethoden einen systematischeren und objektiveren Zugang zu diesen Daten und deren Umsetzung ermöglichen? Ganz ohne Zweifel. Allerdings hat computergestütztes Arbeiten in der medizinischen Chemie bisher eine im Wesentlichen andere Rolle gespielt. Bei einer Diskussion von Computermethoden mit Relevanz für die medizinische Chemie sollte man unterscheiden zwischen ­Methoden des modernen „Drug Designs“, die in aller Regel von Computerchemikern entwickelt und angewendet werden, oft ­relativ weit entfernt von der Praxis der medizinischen Chemie, und Methoden, die seit langer Zeit praxisnah angewendet werden. Hierbei handelt es sich in erster Linie um Methoden, die auf dem mittler­weile klassischen „Quantitativen SAR“ (QSAR)-Paradigma basieren [4]. Der ursprünglichen Konzeption folgend, versucht QSAR lineare mathematische Modelle biologischer Aktivität auf der Basis von molekularen Deskriptoren zu entwickeln. QSAR-Modelle werden für individuelle Verbindungsreihen mit Molekülen bekannter Aktivität generiert und dann angewendet, um die Wirksamkeit neuer Analoge vorherzusagen. Obwohl gängige QSAR-Methoden oft in ihren Details variieren, versuchen alle QSAR-Analysen im Grunde die Kernfrage zu adressieren, die für jeden praktizierenden medizinischen Chemiker im Mittelpunkt seiner Arbeit steht: Welche Verbindung soll ich als nächste synthetisieren? Dieser Zusammenhang erklärt die Popularität der praxisnahen QSAR-Analyse in der medizinischen Chemie und erklärt auch, ­warum medizinische Chemiker in aller Regel mehr an Aktivitätsvorhersagen interessiert sind als an computergestützter SAR-­Datensuche und -analyse. Bei der derzeitigen Datenexplosion stellt diese Orientierung natürlich auch ein Problem für den Fortschritt der medizinischen Chemie dar, das inzwischen zunehmend erkannt und diskutiert wird.

Neue Konzepte

Die Erkenntnis, dass Computeranwendungen in der medizinischen Chemie über konventionelle (Q)SAR-Analysen hinaus­gehen sollten, um vermehrte Wissensgewinnung aus großen Mengen interner und externer SAR-Daten zu ermöglichen, hat in der letzten Zeit die Entwicklung konzeptionell neuer Methoden katalysiert. In schwierigen Zeiten für die Pharmaindustrie kann man es sich natürlich nicht leisten, auf dieses Wissen zu verzichten. Man muß aus vielen mehr oder weniger abgeschlossenen (erfolgreichen oder erfolglosen) Projekten vermehrt lernen, um datenorientierte Planungen und Entscheidungen zu ermöglichen. So sind in den letzten Jahren neue Computermethoden zur groß angelegten und systematischen Analyse heterogener SAR-Daten entwickelt worden, die z. B. in der Lage sind, die Evolution von SARs über viele unterschiedliche Molekülserien zu ver­folgen, sowohl komplexe als auch subtile SAR Trends zu detektieren und Verbindungen mit besonders hohem SAR-Informationsgehalt zu identifizieren. Zum Beispiel werden neue numerische SAR-Ana­lysefunktionen dazu verwendet, molekulare Struktur- und Aktivitätsähnlichkeiten systematisch zu vergleichen und SAR-Infor­ma­tionsgehalt konsistent zu quantifizieren [5]. Zusätzlich sind effiziente Algorithmen entwickelt worden, um struktur­verwandte Molekülpaare mit genau definierten Struktur­unterschieden aus großen Datensätzen zu extrahieren [6] und mit SAR-Information zu assoziieren [7]. Darüber hinaus spielen Visu­alisierungsmethoden eine bedeutende Rolle [8].

SAR-Visualisierung

Die Anwendbarkeit numerischer Beschreibungen von SAR-Eigenschaften ist in der praktischen medizinischen Chemie oft begrenzt. Die Ergebnisse groß angelegter SAR-Analysen müssen Chemikern in intuitiver Weise zugänglich gemacht werden, gerade dann, wenn SAR-Muster komplex sind. Für große Datensätze sind dazu neue Visualisierungsmethoden erforderlich, die zunehmend an Popularität gewinnen. Das Konzept einer „Aktivitätslandschaft“ ist dabei besonders geeignet für die Visuali­sierung von SAR-Informationen. Eine Aktivitätslandschaft ist in der computergestützten medizinischen Chemie generell definiert als eine grafische Darstellung, die Struktur- und Aktivitätsinformationen innerhalb eines großen molekularen Datensatzes in systematischer und konsistenter Weise integriert [9]. In einer besonders intuitiven Form kann eine Aktivitätslandschaft dreidimensional dar­gestellt werden. Dazu wird zu einer computergenerierten zweidimensionalen Projektion des Bereichs des chemischen Raumes, den ein Datensatz einnimmt, biologische Aktivität als dritte Dimension hinzugefügt. Dieses erfordert die Anwendung von Interpola­tionsfunktionen, um aus den Aktivitätsdaten individueller Moleküle eine kohärente Aktivitätsoberfläche zu erstellen. Die resultierende dreidimensionale Ansicht erinnert uns an Darstellungen „wirklicher“ Landschaften mit flachen und hügeligen Regionen, steilen Bergen und Klippen. Diese „geografischen“ Elemente in Aktivitätslandschaften repräsentieren konkrete SAR-Muster mit unterschiedlichem Informationsgehalt. In flachen und leicht hügeligen Regionen behalten Moleküle mit zunehmend diversen Strukturen vergleichbare Aktivität, ein Phänotyp, der oft als „SAR-Kontinuität“ rationalisiert wird. Im Gegensatz dazu repräsentieren bergige Regionen und Gipfel Gruppen von strukturell sehr ähnlichen Verbindungen, die signifikante Aktivitätsunterschiede aufweisen. Dieser SAR-Phänotyp wird dann als „SAR-Diskontinuität“ bezeichnet. Paare von sehr ähnlichen Molekülen mit sehr großen Wirksamkeitsunterschieden stellen eine extreme Form von SAR-Diskontinuität dar und werden als „Aktivitätsklippen“ bezeichnet [10]. In diesem Fall führen kleine chemische Änderungen zu großen Aktivitätsvariationen und Aktivitätsklippen sind deshalb besonders SAR-informativ und oft ein ­Fokalpunkt für die medizinische Chemie. Zusätzlich zu dreidimensionalen Modellen sind eine Reihe weitere Darstellungen von Aktivitätslandschaften eingeführt worden, die SAR-Trends und -Muster in großen Datensätzen ebenfalls genau reflektieren; beispielsweise molekulare Netzwerke, in denen Knoten aktive Moleküle und Kanten paarweise strukturelle Ähnlichkeitsbeziehungen darstellen. Diese Netzwerke werden dann mit zusätzlichen SAR-relevanten Informationen annotiert. Ein prototypisches SAR-Netzwerk ist der so genannte „Network-like Similarity Graph“ (NSG) [9]. Hier werden die Molekülknoten gemäß ihrer Aktivität farbkodiert und in ihre Größe skaliert gemäß dem Beitrag, den ein Molekül zu lokaler SAR-Diskontinuität liefert. Ein Molekül, das in seiner Wirksamkeit stark von seinen ähnlichsten Strukturnachbarn abweicht, leistet einen hohen Beitrag zu l­okaler SAR-Diskontinuität. In NSGs stellen deshalb Paare von großen grünen (niedrige Wirksamkeit) und roten Knoten (hohe Wirksamkeit), die durch Kanten verbunden sind, Aktivitätsklippen dar, die leicht identifiziert und ­interaktiv selektiert werden können. Das NSG-Design ermöglicht den Vergleich globaler und lokaler SAR-Eigenschaften in heterogenen Datensätzen und die Identifizierung von informationsreichen SAR-Mustern und den dafür verantwortlichen Molekülen. Methoden für eine groß angelegte und systematische SAR-Analyse und Visualisierung erweitern das Anwendungsspektrum traditioneller QSAR-Verfahren und fügen der computergestützten medi­zinischen Chemie eine neue Dimension zu. Diese Methoden ermöglichen eine effiziente Analyse extrem schnell wachsender Datenmengen und machen die Ergebnisse in grafisch-intuitiver Form für praktische Anwendungen in der medizinischen Chemie zugänglich. Es ist mehr als wahrscheinlich, dass die Entwicklung und Anwendung dieser Art von Computermethoden in der Zukunft weiter expandieren wird.

Literatur
[1] Lajiness, M.S. et al. [2004] J. Med. Chem. 47, 4891-4896.
[2] Gaulton, A. et al. [2012] Nucleic Acids Res. 40, D1100-D1107.
[3] Wang, Y. et al. [2012] Nucleic Acids Res. 40, D400-D412.
[4] Esposito, E.X. et al. [2004] Methods Mol. Biol. 275, 131-214.
[5] Peltason, L. & Bajorath, J. [2009] Future Med. Chem. 1, 451-466.
[6] Hussain, J. & Rea, C. [2010] J. Chem. Inf. Model. 50, 339-348.
[7] Wassermann, A.M. et al. [2012] Drug Develop. Res. 73, 518-527.
[8] Stumpfe, D. & Bajorath, J. [2012] RSC Adv. 2, 369-378.
[9] Wassermann, A.M. et al. [2010] J. Med. Chem. 53, 8209-8223.
[10] Stumpfe, D. & Bajorath, J. [2012] J. Med. Chem. 55, 2932-2942.

Foto: © istockphoto.com|
Abb 1-2: © Prof. Dr. Jürgen Bajorath

L&M 3 / 2013

Diese Artikel wurden veröffentlicht in Ausgabe L&M 3 / 2013.
Das komplette Heft zum kostenlosen Download finden Sie hier: zum Download

Der Autor:

News

Schnell und einfach die passende Trennsäule finden

Schnell und einfach die passende Trennsäule finden
Mit dem HPLC-Säulenkonfigurator unter www.analytics-shop.com können Sie stets die passende Säule für jedes Trennproblem finden. Dank innovativer Filtermöglichkeiten können Sie in Sekundenschnelle nach gewünschtem Durchmesser, Länge, Porengröße, Säulenbezeichnung u.v.m. selektieren. So erhalten Sie aus über 70.000 verschiedenen HPLC-Säulen das passende Ergebnis für Ihre Anwendung und können zwischen allen gängigen Herstellern wie Agilent, Waters, ThermoScientific, Merck, Sigma-Aldrich, Chiral, Macherey-Nagel u.v.a. wählen. Ergänzend stehen Ihnen die HPLC-Experten von Altmann Analytik beratend zur Seite – testen Sie jetzt den kostenlosen HPLC-Säulenkonfigurator!

© Text und Bild: Altmann Analytik

ZEISS stellt neue Stereomikroskope vor

ZEISS stellt neue Stereomikroskope vor
Aufnahme, Dokumentation und Teilen von Ergebnissen mit ZEISS Stemi 305 und ZEISS Stemi 508

ZEISS stellt zwei neue kompakte Greenough-Stereomikroskope für Ausbildung, Laborroutine und industrielle Inspektion vor: ZEISS Stemi 305 und ZEISS Stemi 508. Anwender sehen ihre Proben farbig, dreidimensional, kontrastreich sowie frei von Verzerrungen oder Farbsäumen.

© Text und Bild: Carl Zeiss Microscopy GmbH