Projektbereich C
Modellbildung, Robustheit und Synthese von Schaltkreisen

In CompuGene kommen verschiedene Modellierungsansätze zum Einsatz. Abhängig von der Problemstellung werden molekulardynamische, kinetische oder auch abstraktere Modellierungsansätze untersucht.

Ziel des Projektbereichs C ist eine Infrastruktur in Form von Berechnungsverfahren zu entwickeln, die es erlaubt, genetische Schaltkreise am Computer zu entwerfen und deren Verhalten vorherzusagen.

Dazu werden in CompuGene Schaltkreise und Schaltkreiskomponenten in Modelle verschiedener Granularität übergeführt. Modelle werden dabei nicht nur als mathematische Gleichungen verstanden, sondern können auch reine Berechnungsvorschriften in Form von Computerprogrammen sein. Kinetische Populationsmodelle werden benötigt, um das Verhalten des gesamten Schaltkreises auf einer physiologischen Zeitskala berechnen zu können, während molekulardynamische Modelle Aufschluss über strukturelle Eigenschaften von einzelnen Schaltkreiskomponenten ermöglichen. Computerprogramme anderseits bieten viele Freiheiten in der Modellbeschreibung und können heutzutage mithilfe formaler Methoden der Informatik ähnlich analysiert werden wie mathematische Modelle.

Die Modellbildung in CompuGene konzentriert sich darauf, die Kontextabhängigkeit experimenteller Schaltkreise richtig abzubilden. Um diese Modelle prädiktiv zu machen, werden in CompuGene Inferenzalgorithmen angewendet und weiterentwickelt, die auf Daten der Projektbereiche A und B zurückgreifen. Kalibrierte, kontextabhängige Modelle werden dann hinsichtlich ihrer Robustheit untersucht. Im Speziellen geht es um die Identifizierung jener Kontextvariablen, die sich am stärksten auf das Schaltkreisverhalten auswirken.

Das Verständnis daraus eröffnet CompuGene dann die Möglichkeit, Schaltkreise am Computer hinsichtlich ihrer Robustheit zu optimieren. Zusätzlich geht CompuGene darüber hinaus und entwickelt Methoden, die es ermöglichen, zuvor charakterisierte Schaltkreiskomponenten zu vollkommen neuen Schaltkreisen zusammenzufügen. Dabei kommen Konzepte der formalen Synthese von Programmen und von digitalen Schaltungen zur Anwendung. Dieser Ansatz stellt so eine vielversprechende Alternative zum jetzigen „trial-and-error“ Entwurfsverfahren dar.

Projekt C-1:

Molekular-biophysikalische Modellierung von Kontextabhängigkeiten

Projektleiter: Kay Hamacher

Die molekulare Funktionalität und die Konstruktion von Gattern und Schaltkreisen aus einzelnen Komponenten ist durch die biophysikalischen Grundlagen bedingt. Um daher Modularisierung, Robustheit und Kombinierbarkeit der Schaltkreise einschätzen und beherrschen zu können, müs-sen molekulare Modelle erstellt werden und so die Längenskalen submolekularer Komponenten von Nukleotiden bis zum intrazellulären System in silico simuliert werden. Hierzu werden aus grundsätzlichen (Ressourcen), aber auch pragmatischen Gründen (engineering als Ziel) sogenannte coarse-graining Ansätze genutzt, die in der letzten Dekade eine Vielzahl an qualitativen Einblicken in die Molekular-, Struktur- und Zellbiologie erlaubt haben.

Im Projekt C-1 werden daher erarbeitete coarse-grained Modelle für Proteine und Nukleotide genutzt, um Anschluss an die Längenskalen der darüber liegenden Modelle des Projekts C-2 zu gewährleisten und die molekulare Welt für die Modellierung der Schaltkreise zu erschließen. Weiterhin werden diese Modelle um atomistische Effekte erweitert (basierend auf den Erfahrungen der AG Hamacher im Bereich knowledge-based potential und der ab initio Parametrisierung). Diese Erweiterung lässt dann die in silico Kombinierbarkeit von Aptameren in Projekt A-1 zu, sowie die detaillierte, molekulare Analyse von Synergie-Effekten und bekannten, aber ungewolltem cross talk bei der Komposition von Schaltkreisen. Die konkreten Forschungsfragen sind:

(1) wie können niedermolekulare Liganden von Aptameren (insbesondere Tetrazyklin und Neomycin) zur Nutzung in elastic network models der Mechanik der RNA parametrisiert werden?

(2) Wie können Modelle der RNA-Faltung mit Parametern der Aptamerumgebung erweitert werden (context dependency), um die Thermodynamik der RNA-Schalter zu untersuchen?

(3) Wie können diese detaillierten Er-kenntnisse in die Modellierung von Populationsmodellen einfließen?

Projekt C-2:

Inferenzalgorithmen für Schaltkreismodelle und deren Kontextabhängigkeit

Projektleiter: Heinz Köppl

Um Modelle von Komponenten und Schaltkreisen zu erstellen, die quantitativ den Daten aus den Projektbereichen A und B folgen, müssen die Modellparameter, Modellstrukturen und auch Kontextabhängigkeiten aus den Daten gelernt werden. Nachdem sich Schaltkreisverhalten und Robustheit stark mit den gewählten Parameterwerten ändern, sind Modelle ohne Parametrisierung nur bedingt für die anderen Projekte im Bereich C brauchbar. Im Speziellen tritt bei der Komposition von Schaltkreiskomponenten (C-3 und C-4) eine Fortpflanzung der Unsicherheit auf, die dazu führt, dass ohne vorherige Modellinferenz keine Aussage über das Gesamtverhalten gemacht werden kann. Die entwickelte Messtechnik aus Bereich B bietet eine vielversprechende Datenlage für die Inferenz, verlangt aber auch nach der Entwicklung von maßgeschneiderten numerischen Verfahren.

Dieses Projekt hat das Ziel, neue skalierbare Methoden zu entwickeln, die eine schnelle und robuste Inferenz von stochastischen und deterministischen Populationsmodellen erlaubt. Dabei liegt der Fokus auf Einzelzellmessungen (B-2) und Messungen zellfreier Implementierungen (B-1). Es sollen Parameter, die Kontextabhängigkeit und bedingt auch die Struktur der Modelle gelernt werden. Daraus ergeben sich die folgenden konkreten Forschungsfragen:

(1) Wie lassen sich Kontextabhängigkeiten aus Daten rekonstruieren?

(2) Wie werden Hybridmodelle, die stochastische und deterministische Dynamik kombinieren, effizient gelernt?

(3) Wie können Protokolle aus Bereichen A und B optimiert werden, um maximal informative Daten zur Modellinferenz zu liefern?

Projekt C-3:

Robustheitsanalyse und Kontextabhängigkeit von Schaltkreismodellen

Projektleiterin: Barbara Drossel

Das Verhalten von Komponenten oder eines ganzen Schaltkreises hängt immer auch von der externen Umgebung ab. Sobald man einzelne Komponenten zu einem Schaltkreis zusammenfügt, ändert sich die Umgebung der einzelnen Komponenten. Außerdem beeinflussen insbesondere bei in vivo Experimenten vielfältige zelluläre Einflussfaktoren den Schaltkreis [9], wie z.B. die Verfügbarkeit von Ribosomen, konkurrierende und unspezifische Bindung von Proteinen an DNA- und RNA-Sequenzen, Nukleotidverknappung oder ATP-Verfügbarkeit. Es ist daher wichtig, Schaltkreise zu haben, die robust unter Veränderungen der Umgebung sind oder die gut auf die tatsächliche Umgebung abgestimmt sind. Dies ist sowohl für die in vitro-, als auch die in vivo- Experimente wichtig.

Das Projekt C-3 soll die in C-2 entwickelten und kalibrierten Modelle auf ihre Robustheit und Kontextabhängigkeit untersuchen und gegebenenfalls erweitern. Insbesondere sollen folgende Fragen bearbeitet werden:

(1) Wie robust sind einzelne Komponenten unter Veränderung wichtiger Input- und Outputparameter?

(2) Wie verändert das Zusammenfügen der Komponenten zum Schaltkreis das dynamische Verhalten der Komponenten?

(3) Welche Rolle spielen hierbei stochastische Einflüsse?

(4) Wie reagiert der Schaltkreis auf verschiedene Einflussfaktoren aus dem zellulären Kontext, die sich in den Experimenten als wichtig erweisen?

Projekt C-4:

Verifikation und Synthese von Schaltkreisen

Projektleiter: Reiner Hähnle

In diesem Teilprojekt werden genetische Schaltkreise mit Methoden zur formalen Beschreibung von Software modelliert, analysiert und entworfen. Im Gegensatz zu den anderen Teilprojekten aus Projektbereich C werden hier diskrete, symbolische, logikbasierte Beschreibungsformalismen an-gewandt, welche für die Modellierung nebenläufiger Programme entwickelt wurden. Dies erlaubt präzise Modellierung komplexer interner Zustände von Schaltkreisen und deren zellulären Umge-bung. Außerdem werden ursprünglich für die formale Beschreibung von Software entwickelte, ausgereifte Modularisierungskonzepte erstmals für die Modellierung genetischer Schaltkreise verwendet. Formale Softwaremodelle haben den Vorteil, dass sie ablauffähig sind, also direkt simuliert und visualisiert werden können. Sie können auch maschinell analysiert werden und ermöglichen – in Analogie zur Testfallgenerierung – die automatische Generierung gezielter Experimente, die dann in den Projektbereichen A und B durchgeführt werden. Das übergeordnete Ziel des Pro-jektes ist es, aus den formalen Modellen optimierte, genetische Schaltkreise zu synthetisieren.