Читать книгу Leben - Ник Лейн - Страница 9
2 DNA
ОглавлениеDer Code des Lebens
2003 wurde am Eagle Pub in Cambridge eine blaue Gedenktafel zur Erinnerung an den 50. Jahrestag eines ungewöhnlichen Pub-Gespräches angebracht. Zur Mittagszeit des 28. Februar 1953 platzten die beiden Stammgäste James Watson und Francis Crick in den Pub und verkündeten, sie hätten das Geheimnis des Lebens gelüftet. Obwohl der schroffe Amerikaner und der redselige Brite mit dem irritierenden Lachen zuweilen stark an ein Komikerduo erinnerten, waren sie diesmal ernst – und hatten halb recht. Wenn man sagen kann, dass das Leben ein Geheimnis hat, dann ist dies zweifellos die DNA. Crick und Watson kannten jedoch, trotz all ihrer Klugheit, nur das halbe Geheimnis.
An jenem Morgen hatten Crick und Watson herausgefunden, dass die DNA eine Doppelhelix ist – ein inspirierender Gedankensprung, dem eine Mischung aus Genie, Modellbau, chemisch begründeten Schlussfolgerungen und einigen gestohlenen Röntgenfotos zugrunde lag. Ihre Idee war, in Watsons Worten, einfach so schön, dass sie wahr sein musste. Und je mehr sie darüber beim Mittagessen redeten, desto mehr wurde ihnen bewusst, dass dies stimmte. Das Ergebnis ihrer Diskussionen wurde am 25. April als einseitiger Letter in Nature veröffentlicht – eine Art Ankündigung, ähnlich einer Geburtsanzeige in einer örtlichen Tageszeitung. In einem ungewöhnlich bescheidenen Ton (Watson sagte einmal, dass er Crick niemals bescheiden erlebt habe, und er selbst war auch nicht besser) endete die Abhandlung mit der zurückhaltenden Untertreibung: »Es ist uns nicht entgangen, dass die von uns festgestellte typische Paarung unmittelbar auf einen möglichen Kopiermechanismus für das genetische Material schließen lässt.«
DNA ist in der Tat der Stoff, aus dem die Gene sind, das Erbmaterial. DNA codiert Menschen und Amöben, Pilze und Bakterien, einfach alles auf dieser Erde, mit Ausnahme einiger weniger Viren. Ihre Doppelhelix ist ein wissenschaftliches Symbol – die beiden Helices, die sich umeinander drehend endlos weiterverfolgen lassen. Watson und Crick zeigten, dass jeder Strang den anderen auf molekularer Ebene ergänzt. Bricht man die Stränge auf, so verhält sich jeder wie eine Vorlage, die zur Erneuerung des Gegenstückes dient – es bilden sich wieder zwei identische Doppelhelices, wo vorher eine war. Jedes Mal, wenn ein Organismus sich reproduziert, gibt er eine Kopie seiner DNA an seinen Nachwuchs weiter. Alles, was er dazu tun muss, ist, die beiden DNA-Stränge auseinanderzubrechen, um zwei identische Kopien des Originals herzustellen.
Während einem die einzelnen molekularen Mechanismen Kopfschmerzen bereiten können, ist das Prinzip an sich wunderschön, atemberaubend und einfach. Der genetische Code ist eine Abfolge von Buchstaben (fachlicher ausgedrückt »Basen«). Das DNA-Alphabet besteht lediglich aus vier Buchstaben – A, T, G und C. Diese stehen für Adenin, Thymin, Guanin und Cytosin, aber die chemischen Namen brauchen uns nicht zu kümmern. Der Punkt ist, dass sich, bedingt durch ihre Form und Bindungsstruktur, A nur mit T und C nur mit G paaren kann (s. Abb. 2.1). Brechen wir die Doppelhelix auf, so zeigt jeder Strang borstige Enden aus ungepaarten Buchstaben. An jedes herausstehende A kann nur ein T gebunden werden, an jedes C nur ein G und so weiter. Die Basenpaare ergänzen sich nicht nur, sie wollen sich wirklich miteinander verbinden. Es gibt nur eine Möglichkeit, einem T das öde chemische Dasein zu verschönern, und das ist die vertraute Nähe zu einem A. Sobald sie sich gefunden haben, stimmen sie ein harmonisch klingendes Liebeslied an. Das ist wahre Chemie: eine authentische »Grundanziehung«. Die DNA ist also keineswegs nur eine passive Kopiervorlage; jeder Strang übt auch eine gewisse Anziehung auf sein zweites Ich aus. Trennen wir die beiden DNA-Stränge voneinander, werden sie sich spontan wieder miteinander verbinden. Halten wir sie voneinander getrennt, so bleibt jeder Strang eine Kopiervorlage mit der drängenden Sehnsucht nach dem perfekten Partner.
Die Buchstabenfolge in der DNA erscheint endlos lang. Im menschlichen Genom gibt es beispielsweise annähernd drei Milliarden Buchstaben (Basenpaare) – drei Gigabasen im Fachjargon. Das heißt, ein einziger Chromosomensatz im Kern einer Zelle umfasst eine Liste mit 3.000.000.000 einzelnen Buchstaben. Ausgedruckt würde das menschliche Genom etwa 200 Bände von der Größe eines Telefonbuches füllen. Und das menschliche Genom ist keineswegs das größte. Überraschenderweise hält diesen Rekord eine schäbige Amöbe, Amoeba dubia, mit einem gigantischen Genom aus 670 Gigabasen, das damit 220-mal größer ist als unser eigenes. Das meiste davon scheint »Junk« zu sein, unbrauchbares Material, das überhaupt nichts codiert.
Abb. 2.1 Basenpaare in der DNA. Die Geometrie der Buchstaben bedeutet, dass sich G nur mit C und A nur mit T verbindet.
Jedes Mal, wenn eine Zelle sich teilt, vervielfältigt sie ihre gesamte DNA. Dieser Prozess läuft in einem Zeitraum von einigen Stunden ab. Der menschliche Körper ist ein Monster aus 15 Millionen Millionen Zellen und jede davon beherbergt ihre eigene genaue Abschrift von derselben DNA (zwei Abschriften, um genau zu sein). Um Ihren Körper aus einer einzigen Eizelle zu formen, wurden Ihre DNA-Helices auseinandergebrochen, um 15 Millionen Millionen Mal als Vorlage zu dienen (tatsächlich sogar noch viel öfter, da Zellen sterben und ständig ersetzt werden). Jeder Buchstabe wird mit einer Genauigkeit kopiert, die an ein Wunder grenzt: Die nachgebildete Buchstabenfolge weicht mit einer Fehlerrate von etwa einem Buchstaben zu 1.000 Millionen vom Original ab. Zum Vergleich müsste ein Schriftgelehrter, der mit der gleichen Präzision arbeitet, die ganze Bibel 280-mal abschreiben, bevor er einen einzigen Fehler macht. Tatsächlich lag die Trefferquote des Schriftgelehrten bei Weitem niedriger. Für das Neue Testament soll es 24.000 hinterlassene Manuskripte geben und keine zwei davon sind identisch.
Dennoch treten auch in der DNA Fehler auf, wenn auch nur, weil das Genom so extrem groß ist. Solche Fehler werden Punktmutationen genannt, bei denen ein Buchstabe versehentlich durch einen anderen ersetzt wird. Jedes Mal, wenn eine menschliche Zelle sich teilt, können wir etwa drei Mutationen pro Chromosomensatz erwarten. Und je öfter sich eine Zelle teilt, umso mehr solcher Mutationen sammeln sich an und führen letztendlich zu Krankheiten wie Krebs. Mutationen überspringen auch Generationen. Entwickelt sich aus einem befruchteten Ei ein weiblicher Embryo, sind 30 Zellteilungen nötig, bevor eine neue Eizelle gebildet wird; und bei jeder Teilung sammeln sich ein paar Mutationen mehr an. Männer sind noch schlimmer: 100 Zellteilungen werden benötigt, um Sperma zu produzieren, und mit jeder Teilung sind unerbittlich weitere Mutationen verbunden. Da die Spermaproduktion das ganze Leben über abläuft, wird es nach jeder weiteren Zellteilung schlimmer, je älter der Mann also wird. Der Genetiker James Crow drückt es so aus, dass fruchtbare alte Männer das größte veränderliche Gesundheitsrisiko in einer Population darstellen. Doch sogar ein durchschnittliches Kind von jungen Eltern hat im Vergleich zu diesen etwa 200 neue Mutationen (wenn auch nur eine Handvoll von ihnen unmittelbar gesundheitsgefährdend sind).1
So kommt es, trotz der bemerkenswerten Genauigkeit, mit der die DNA kopiert wird, zu Veränderungen. Jede Generation unterscheidet sich von der vorangegangenen, nicht nur, weil unsere Gene durch Sex vermischt werden, sondern auch, weil wir alle neue Mutationen tragen. Viele dieser Mutationen sind die »Punkt«-Mutationen, über die wir gesprochen haben – die Veränderung eines einzelnen DNA-Buchstabens –, aber manche sind, zusammengenommen, tiefgreifender. Ganze Chromosomen werden vervielfältigt oder können sich nicht voneinander trennen; weite Abschnitte der DNA werden gelöscht; Viren bauen neue Stücke ein; Teile von Chromosomen vertauschen sich selbst, indem sie die Buchstabensequenz umdrehen. Die Möglichkeiten sind endlos. Jedoch sind die schlimmsten Veränderungen kaum mit dem Überleben vereinbar. So gesehen, brodelt es im Genom wie in einer Schlangengrube, mit sich dahinschlängelnden Chromosomen, die in steter Unruhe miteinander verschmelzen und sich wieder trennen. Natürliche Selektion sorgt erst einmal für Stabilität, indem diese Monster, bis auf das letzte, aussortiert werden. Die DNA verwandelt und verdreht sich, die Selektion bringt alles wieder in Ordnung. Jegliche positive Veränderung wird festgehalten, während schwerwiegendere Fehler oder Umbildungen buchstäblich verlorengehen. Andere Mutationen, die weniger gravierend sind, können mit Krankheiten in Verbindung gebracht werden, die später im Leben auftreten.
Die veränderliche Buchstabensequenz in der DNA steht hinter annähernd allem, was wir in wissenschaftlichen Abhandlungen, die sich mit unseren Genen beschäftigen, lesen. Der genetische Fingerabdruck beispielsweise, der dazu benutzt wird, um die Vaterschaft festzustellen, Präsidenten wegen Amtsvergehen anzuklagen oder mutmaßliche Täter Jahrzehnte nach der Tat zu belasten, basiert auf Unterschieden in der Buchstabensequenz zwischen den Einzelpersonen. Da es so viele Unterschiede in der DNA gibt, haben wir alle unseren eigenen einzigartigen genetischen »Fingerabdruck«. Ebenso beruht unsere Anfälligkeit für viele Krankheiten auf winzigen Abweichungen in der DNA-Sequenz. Menschen unterscheiden sich durchschnittlich ungefähr in einem von 1000 Buchstaben. Im menschlichen Genom sind dies sechs bis zehn Millionen einzelne Buchstabenunterschiede, die auch »Snips« genannt werden (für »single nucleotide polymorphisms«). Das Vorhandensein von Snips bedeutet, dass wir alle geringfügig voneinander abweichende Varianten von den meisten Genen besitzen. Während viele Snips sicherlich nahezu unbedeutend sind, stehen andere in Zusammenhang mit der Veranlagung für Krankheiten wie Diabetes oder Alzheimer. Wie sie sich im Einzelnen auswirken, ist in den meisten Fällen wissenschaftlich leider noch unzureichend erforscht.
Trotz dieser Unterschiede ist es dennoch möglich, sich über das »menschliche Genom« zu unterhalten, denn trotz aller Snips sind in uns allen immer noch 999 Buchstaben von 1000 identisch. Hierfür gibt es zwei Gründe: Zeit und Selektion. Evolutionsgeschichtlich betrachtet, ist seit der Zeit, in der wir alle Affen waren, nicht viel Zeit vergangen; ein Zoologe würde mir gewiss versichern, dass wir immer noch Affen sind. Die ersten Menschen entwickelten sich vor etwa sechs Millionen Jahren aus dem gemeinsamen Vorfahren, den wir mit den Schimpansen haben. Seitdem haben sich in jeder nachfolgenden Generation 200 Mutationen angesammelt. In dieser uns zur Verfügung stehenden Zeit konnten wir gerade einmal 1 % unseres Genoms verändern. Da Schimpansen sich mit der gleichen Mutationsrate entwickelt haben, müssten wir theoretisch eine Abweichung von 2 % zwischen uns und ihnen erwarten. Tatsächlich ist der Unterschied etwas kleiner. Hinsichtlich ihrer DNA-Sequenz sind Schimpansen und Menschen zu etwa 98,6 % identisch.2 Der Grund dafür ist, dass die Selektion gewissermaßen die Bremse betätigt, indem sie die meisten der schädlichen Veränderungen beseitigt. Wenn Veränderungen durch Selektion beseitigt werden können, sind sich die Sequenzen, die fortbestehen, offensichtlich ähnlicher, als sie es sein würden, wenn die Veränderungen ungebremst erfolgen würden; die Selektion bringt also, wie gesagt, alles wieder in Ordnung.
Verfolgen wir die Zeit noch weiter zurück, sehen wir, dass Zeit und Selektion sich zusammentaten, um gemeinsam den schönsten und aufwendigsten Bilderteppich zu weben. Alle Lebewesen auf unserem Planeten sind miteinander verwandt und aus den Buchstaben in ihrer DNA können wir herauslesen, wie. Indem wir DNA-Sequenzen miteinander vergleichen, können wir statistisch errechnen, wie nah wir mit wem verwandt sind, von Affen bis hin zu Beuteltieren, Reptilien, Amphibien, Fischen, Insekten, Krebstieren, Würmern, Pflanzen, Protozoen, Bakterien – zu wem immer Sie wollen. Wir alle sind durch genau miteinander vergleichbare Buchstabensequenzen spezifiziert. Wir besitzen sogar identische Sequenzabschnitte, die bei der Selektion beibehalten wurden, während sich andere Abschnitte bis zur Unkenntlichkeit verändert haben. Lesen wir die DNA-Sequenz eines Kaninchens, so werden wir die gleiche endlos lange Basenfolge finden. Einige Sequenzen davon sind mit unseren eigenen identisch, andere unterscheiden sich von ihnen und alle sind miteinander vermischt, wie in einem Kaleidoskop. Das Gleiche gilt für eine Distel: Die Sequenz ist identisch oder stellenweise ähnlich, aber nun unterscheiden sich größere Abschnitte, die sowohl den langen Zeitraum, der vergangen ist, seit unser gemeinsamer Vorfahr lebte, widerspiegeln als auch unsere völlig voneinander abweichenden Lebensweisen. Unsere innere Biochemie ist jedoch die gleiche geblieben. Wir bestehen alle aus Zellen, die auf weitgehend ähnliche Weise funktionieren und immer noch von den gleichen DNA-Sequenzen codiert werden.
Angesichts dieser innigen biochemischen Gemeinsamkeiten würden wir erwarten, dass wir sogar bei den mit uns am entferntesten verwandten Lebensformen, wie Bakterien, gemeinsame DNA-Sequenzen finden – und genau das tun wir. Tatsächlich gibt es hier aber etwas, das Verwirrung stiftet, denn die Sequenzähnlichkeit wird nicht, wie man erwarten würde, auf einer Skala von 0 bis 100 %, sondern von 25 bis 100 % aufgetragen. Dies haben wir den vier Buchstaben der DNA zu verdanken. Wird ein Buchstabe zufällig durch einen anderen ersetzt, besteht eine Wahrscheinlichkeit von 25 %, dass der gleiche Buchstabe ersetzt wird. Stellen wir wahllos einen DNA-Abschnitt im Labor von Grund auf künstlich her, muss es ebenso notwendigerweise eine 25-prozentige Sequenzähnlichkeit zu jedem beliebig anderen unserer Gene geben – die Wahrscheinlichkeit, dass jeder Buchstabe einem Buchstaben in der menschlichen DNA entspricht, beträgt ein Viertel. Demzufolge ist die Idee, dass wir eine »halbe Banane« sind, weil wir 50 % unserer Genomsequenz mit einer Banane teilen, milde ausgedrückt, irreführend. Derselben Überlegung zufolge wäre jeder zufällig generierte DNA-Abschnitt ein Viertel Mensch. Solange wir nicht wissen, was die Buchstaben eigentlich bedeuten, tappen wir völlig im Dunkeln.
Und dies ist der Grund, weshalb Watson und Crick an jenem Morgen im Jahre 1953 nur das halbe Geheimnis des Lebens gelüftet haben. Sie kannten die Struktur der DNA und verstanden, wie jeder Strang der Doppelhelix als Kopiervorlage für einen anderen dienen und so den Erbcode für jeden Organismus bilden konnte. Was sie in ihrer berühmten Abhandlung nicht erwähnten, da es weitere zehn Jahre geistreicher Forschungsarbeit bedurfte, um es herauszufinden, war, was die Buchstabensequenzen nun eigentlich codieren. Trotz der hoheitsvollen Symbolik der Doppelhelix, die sich kein bisschen um die Buchstaben in ihrer Spirale schert, war die Entzifferung des Codes des Lebens vielleicht die größere Errungenschaft – eine, durch die Crick Berühmtheit erlangte. Am wichtigsten ist, unserer Ansicht nach, in diesem Kapitel zu erwähnen, dass der entzifferte Code, der anfangs das leidigste Rätsel in der modernen Biologie war, uns faszinierende Einblicke gewährt, wie die DNA vor ungefähr vier Milliarden Jahren entstanden ist.
*
Abb. 2.2 Die DNA-Doppelhelix mit ihren beiden umeinandergeschlungenen Helices. Trennt man die beiden Stränge, so kann jeder als Kopiervorlage für einen neuen Ergänzungsstrang dienen.
Die DNA scheint so modern zu sein, dass es schwierig ist, die Lösungsansätze der Molekularbiologie aus dem Jahre 1953 zu würdigen. Sie entsprang der ursprünglichen Abhandlung von Watson und Crick und ihre Struktur wurde von Cricks Ehefrau Odile, die Künstlerin war, schematisch dargestellt – die verdrehte Leiter wird praktisch ohne Veränderungen seit einem halben Jahrhundert abgezeichnet (s. Abb. 2.2). Watsons berühmtes Buch, Die Doppelhelix, das in den 1960er Jahren verfasst wurde, malt ein modernes Bild der Wissenschaft. Tatsächlich war es so einflussreich, dass das Leben wohl begann, die Kunst nachzuahmen. Ich, beispielsweise, las Watsons Buch in der Schule und träumte von Nobelpreisen und bahnbrechenden Entdeckungen. Rückblickend wurde mir die wirkliche Bedeutung der Wissenschaft fast gänzlich durch Watsons Buch bewusst und die unvermeidliche Ernüchterung, die ich an der Universität erlebte, mag gut von der fehlenden Realität herrühren, die meinen Erwartungen nicht gerecht wurde. Ich hatte mich abgewendet und stillte meinen Nervenkitzel stattdessen mit Klettersport. Erst einige Jahre später drang die intellektuelle Begeisterung für die Wissenschaft wieder zu mir durch.
Fast alles, was ich dann auf der Universität lernte, war Watson und Crick 1953 noch unbekannt. Heute ist allgemein bekannt, dass Gene Proteine codieren, in den frühen 1950ern herrschte jedoch noch wenig Einigkeit darüber. Als Watson 1951 erstmals Cambridge besuchte, war er bald über die offenkundige Skepsis von Max Perutz und John Kendrew verärgert. Für sie war bislang noch nicht zweifelsfrei bewiesen, dass Gene aus DNA bestehen anstatt aus Proteinen. Während die Molekularstruktur der DNA unbekannt war, war ihr chemischer Aufbau offenkundig und variierte von Art zu Art kaum. Wenn Gene die Grundlage für das Erbgut waren und unzählige Unterschiede zwischen Individuen und Arten codierten, wie konnte eine solch einförmige chemische Verbindung, die sich in ihrer Zusammensetzung vom Tier über die Pflanze bis hin zum Bakterium nicht verändert, die Fülle und Vielfalt des Lebens erklären? Proteine schienen mit ihrer unendlichen Mannigfaltigkeit wesentlich besser für eine derart große Aufgabe geeignet zu sein.
Watson war einer der wenigen Biologen, die von den mühsamen Experimenten des amerikanischen Biochemikers Oswald Avery überzeugt waren. Diese wurden 1944 publiziert und zeigten, dass Gene aus DNA bestehen. Einzig und allein Watsons Begeisterung und Überzeugung veranlassten Crick zu seiner Aufgabe – die Struktur der DNA zu ergründen. Nachdem er dies getan hatte, kam die Frage nach dem Code auf. Und wieder ist das Ausmaß der Ignoranz für die heutige Generation erstaunlich. DNA ist eine endlose Folge von lediglich vier verschiedenen, scheinbar zufällig angeordneten Buchstaben. Im Prinzip war es leicht zu erkennen, dass ihre Anordnung in irgendeiner Weise Proteine codieren könnte. Proteine werden ebenfalls von einer Abfolge aus Bausteinen, den Aminosäuren, aufgebaut. Vermutlich verschlüsselte die Buchstabenfolge der DNA die Folge der Aminosäuren in Proteinen. Wenn der Code jedoch allgemeingültig sein sollte, wie es bereits den Anschein hatte, musste es die Liste der Aminosäuren ebenfalls sein. Diese Annahme war in keiner Weise begründet. Sie wurde sogar kaum in Betracht gezogen, bis zu dem Tag, an dem sich Watson und Crick in Eagle zum Mittagessen zusammensetzten, um die Liste der 20 kanonischen Aminosäuren aufzuschreiben, die heute in allen Lehrbüchern zu finden ist. Bemerkenswerterweise lagen die beiden auf Anhieb richtig, obwohl keiner von ihnen Biochemiker war.
Die Herausforderung war nun angenommen und wurde schnell zu einem mathematischen Spielchen, das keine der anderen molekularen Eigenschaften übertreffen kann, die von späteren Generationen auswendig gelernt wurden. Vier unterschiedliche Buchstaben in der DNA müssen 20 Aminosäuren verschlüsseln. Dies weist eine direkte Transliteration von der Hand; offensichtlich kann ein Buchstabe in der DNA nicht für eine Aminosäure stehen. Auch ein Doppelcode, der nicht mehr als 16 Aminosäuren (4 × 4) verschlüsseln könnte, ist auszuschließen. Es wird eine Mindestanzahl von drei Aminosäuren benötigt: ein Triplettcode (später von Crick und Sydney Brenner nachgewiesen), in dem Gruppen von drei DNA-Buchstaben jeweils eine einzelne Aminosäure codieren. Das erscheint jedoch sehr verschwenderisch. Die vier Buchstaben können in 64 Tripletts (4 × 4 × 4) kombiniert werden und so 64 potenzielle verschiedene Aminosäuren codieren. Warum also nur 20? Die magische Antwort muss für ein Vier-Buchstaben-Alphabet Sinn machen, aus dem 64 Wörter gebildet werden können, wovon jedes aus drei Buchstaben besteht – und dieses Alphabet muss 20 Aminosäuren verschlüsseln.
Passenderweise war der Erste, der überhaupt eine Antwort parat hatte, kein Biologe, sondern der überschwängliche, in Russland geborene amerikanische Physiker George Gamow, der besser für seine Theorien zum Urknall bekannt ist. Für Gamow war die DNA buchstäblich eine Schablone für Proteine: Die Aminosäuren schmiegten sich in die rautenförmigen Zwischenräume in den Biegungen der Helix. Doch Gamows Theorie war im Wesentlichen numerologisch und es beunruhigte ihn ein wenig, einsehen zu müssen, dass Proteine definitiv nicht im Zellkern gebildet werden und daher niemals in direkten Kontakt mit der DNA kommen. Seine Idee war einfach zu abstrakt. Im Wesentlichen schlug er einen überlappenden Code vor, der den großen, bei Kryptographen beliebten Vorteil hatte, die Informationsdichte zu maximieren. Stellen Sie sich eine Sequenz vor, die lautet ATCGTC. Das erste »Wort«, oder fachlicher ausgedrückt »Codon«, wäre ATC, das zweite TCG, das dritte CGT und so weiter. Kritisch betrachtet, beschränken überlappende Codes immer die Sequenz möglicher Aminosäuren. Wenn ATC eine bestimmte Aminosäure codiert, muss dieser eine Aminosäure folgen, deren Codon mit TC beginnt; und das nächste muss mit einem C beginnen. Wenn alle Kombinationsmöglichkeiten mühselig durchgearbeitet werden, sind eine ganze Menge von Tripletts nicht erlaubt: Sie können nicht Teil dieses überlappenden Codes sein, da ein A immer neben einem T sitzen muss, ein T neben einem C und so weiter. Wie viele Tripletts bleiben nun für die Codierung von Aminosäuren übrig? Genau 20!, erklärte Gamow mit der Miene eines Zauberers, der ein Kaninchen aus einem Hut hervorholt.
Es war die erste von vielen cleveren Ideen, die bezüglich dieses gnadenlosen Datenmaterials entwickelt wurden. Alle überlappenden Codes werden von ihren eigenen Beschränkungen sabotiert. Zunächst einmal wurde festgelegt, dass bestimmte Aminosäuren in Proteinen immer nebeneinander auftreten müssen. Fred Sanger jedoch, das stille Genie, das zwei Nobelpreise gewinnen sollte – einen für die Sequenzierung von Proteinen, den anderen für die Sequenzierung der DNA –, war zu dieser Zeit mit der Sequenzierung des Insulins beschäftigt und bald wurde klar, dass jede Aminosäure neben einer anderen auftreten kann: Die Proteinsequenz ist keineswegs eingeschränkt. Ein zweites großes Problem war, dass jede Punktmutation (bei der ein Buchstabe mit einem anderen vertauscht wird) in einem überlappenden Code zwangsläufig mehr als eine Aminosäure betreffen muss. Versuchsdaten zeigten aber, dass häufig nur eine Aminosäure verändert wird. Offensichtlich überlappte der wahre Code nicht. Gamows überlappende Codes wurden widerlegt, lange bevor der wirkliche Code bekannt war. Kryptographen begannen bereits zu vermuten, dass Mutter Natur ein oder zwei Tricks ausgelassen hatte.
Crick selbst war der Nächste, der eine Idee hatte, die so schön war, dass sie sogleich von jedem begrüßt wurde – trotz Cricks eigener Bedenken darüber, dass unterstützende Beweisdaten fehlten. Crick machte sich neue Erkenntnisse zunutze, die aus verschiedenen molekularbiologischen Laboren ans Licht kamen, insbesondere auch aus Watsons eigenem neuen Labor in Harvard. Watson war mittlerweile besessen von der RNA, einer kürzeren, einsträngigen Version der DNA, die sowohl im Cytoplasma als auch im Zellkern entdeckt wurde. Besser noch: Watson nahm an, die RNA sei ein Einbauteil in den winzigen Maschinen, heute als Ribosomen bekannt, die der Ort der Proteinsynthese zu sein schienen. Die DNA sitzt also im Zellkern, träge und unbeweglich. Wird ein Protein gebraucht, so wird ein Abschnitt der DNA als Vorlage für eine RNA-Kopie benutzt, die dann aus dem Zellkern heraus zu den Ribosomen wandert, die draußen warten. Dieser geflügelte Bote wurde bald als Boten-RNA oder mRNA (von messenger RNA) bezeichnet. So beschrieb es Watson bereits 1952 in einem Brief an Crick: »DNA macht RNA macht Protein.« Die Frage, die Crick interessierte, war die: Wie wird die exakte Buchstabensequenz der Boten-RNA in die Aminosäuresequenz eines Proteins übersetzt?
Crick dachte darüber nach und schlug vor, dass eine RNA-Botschaft mithilfe einer Reihe verschiedener »Adapter«-Moleküle übertragen werden könnte, eines für jede Aminosäure. Diese müssten gleichfalls von der RNA erstellt werden und jedes müsste ein »Anti-Codon« besitzen, das ein Codon in der Boten-RNA erkennen und an sich binden kann. Das Prinzip, so sagte Crick, ist exakt das Gleiche wie in der DNA: C paart sich mit G, A mit T und so weiter.3 Die Existenz solcher molekularen Adapter war zu diesem Zeitpunkt rein hypothetisch, sie wurden jedoch wenige Jahre später ordnungsgemäß entdeckt und bestanden aus RNA, wie Crick es vorausgesagt hatte. Sie werden heute Transfer-RNAs oder tRNAs genannt. Die gesamte Konstruktion begann an Lego zu erinnern, mit Bausteinen, die sich verbinden und voneinander lösen, um wundervolle, wenn auch vergängliche Strukturen zu bilden.
Hier lag Crick falsch. Ich werde dies ausführlicher erklären, denn obwohl die Realität etwas fremdartiger ausschaut, als Crick erwartet hatte, mögen seine Ideen dennoch für die Entstehung des Lebens eine Bedeutung haben. Crick stellte sich die Boten-RNA lediglich im Cytoplasma sitzend vor – mit ihren Codons, die an die hervorstehenden Zitzen eines Mutterschweins erinnern und darauf warten, Transfer-RNA, ähnlich wie saugende Ferkel, an sich zu binden. Letztendlich würden sich alle tRNAs Seite an Seite über die ganze Länge der Boten-RNA aneinanderschmiegen und ihre Aminosäuren stünden hervor, wie die Schwänzchen der Ferkel, um zu einem Protein verbunden zu werden.
Cricks Problem war, dass die tRNAs ungeordnet ankommen würden, sobald sie den Schauplatz betraten und sich einfach an das nächstliegende freie Codon heften würden. Wenn sie jedoch nicht am Anfang begannen und am Ende aufhörten – woran würden sie erkennen, wo ein Codon beginnt und das nächste endet? Wie könnten sie das richtige Leseraster feststellen? Wenn die Sequenz, wie vorher, ATCGTC lautet, könnte eine tRNA sich an ATC und die nächste an GTC heften; was aber hinderte eine tRNA daran, das CGT in der Mitte zu erkennen, sich stattdessen daran zu binden und so die ganze Information zu zerstören? Cricks autoritäre Antwort war, es zu verbieten. Wenn die Information als Ganzes unmissverständlich lesbar ist, könnten nicht alle Codons einen Sinn ergeben. Welche dürften nicht erlaubt sein? Sequenzen, die nur aus A, C, U oder G bestehen, scheiden offensichtlich aus; in einer Folge aus AAAAAA würde es keinen Weg geben, das richtige Leseraster zu finden. Crick ging daraufhin alle möglichen Buchstabenkombinationen durch. Kurzum, wenn ATC einen Sinn ergibt, dann müssen alle zyklischen Vertauschungen dieser drei Buchstaben verboten sein (ist also ATC erlaubt, müssen TCA und CAT ausgeschlossen sein). Wie viele Möglichkeiten bleiben dann noch? Wieder genau 20! (Von den 64 möglichen Codons sind AAA, UUU, CCC und GGG ausgeschlossen; es bleiben 60 übrig. Ist nun lediglich eine zyklische Vertauschung von dreien erlaubt, ergibt 60 geteilt durch drei 20.)
Im Gegensatz zu den überlappenden Codes setzt Cricks Code der Anordnung von Aminosäuren in einem Protein keine Grenzen; noch verändert eine Punktmutation zwangsläufig zwei oder drei Aminosäuren. Diese Hypothese war vollkommen mit dem gesamten bekannten Datenmaterial vereinbar und löste das Leseraster-Problem auf erfreuliche Weise, indem sie 64 Codons numerologisch zufriedenstellend auf 20 Aminosäuren reduzierte. Aber trotzdem war sie falsch. Einige Jahre später stellte sich heraus, dass eine synthetische RNA, die vollständig aus AAAs bestand (was Crick ausgeschlossen hatte), schließlich doch die Aminosäure Lysin verschlüsselte und in ein gänzlich aus Lysin aufgebautes Protein-Polymer umgewandelt werden konnte.
Als es hochentwickeltere Untersuchungsmethoden gab, setzten verschiedene Forschungsgruppen Mitte der 1960er Jahre nach und nach den richtigen Code zusammen. Nach den angestrengten kryptographischen Bemühungen, den Code zu knacken, erschien die offensichtlich planlose Realität auf verblüffendste Weise ernüchternd. Weit entfernt von einer eleganten numerologischen Lösung, ist der Code einfach entartet (um nicht zu sagen, völlig uneingeschränkt). Drei Aminosäuren werden von nicht weniger als sechs verschiedenen Codons verschlüsselt, andere nur von ein oder zwei. Alle Codons haben eine Funktion; drei sagen »hier Stopp«, alle anderen codieren eine Aminosäure. Es schien keine Ordnung, keine Schönheit zu geben; stattdessen war es das perfekte Gegenstück zu der Idee, dass Schönheit in der Wissenschaft immer zur Wahrheit führt.4 Es schien noch nicht einmal einen bestimmten strukturellen Anlass zu geben, der für den Code verantwortlich sein könnte; es gab keine klare chemische oder physikalische Verbindung zwischen Aminosäuren und bestimmten Codons.
Crick erklärte den enttäuschenden Code für einen »eingefrorenen Zufall« und die meisten konnten nur nicken und ihm zustimmen. Er sei eingefroren, behauptete er, weil jegliche Versuche, den Code aufzutauen, ernsthafte Konsequenzen haben würden. Eine einzige Punktmutation verändert hier und da eine Aminosäure, wogegen eine Änderung im Code selbst absolut alles katastrophal verändern würde. Der Unterschied besteht darin, entweder einen gelegentlichen Druckfehler in einem Buch vorzufinden, der die Bedeutung kaum verändert, oder das gesamte Alphabet in Kauderwelsch umzuwandeln. Ist der Code erst einmal in Stein gemeißelt, so Crick, würde jede nachfolgende Sabotage mit dem Tod bestraft werden – eine Ansicht, die viele Biologen mit ihm teilen.
Jedoch bereitete die »zufällige« Natur des Codes Crick ein Problem. Warum nur ein Zufall? Warum nicht mehrere? Wenn der Code willkürlich ist, würde kein Code gegenüber einem anderen einen bestimmten Vorteil haben. Es gäbe dann keinen Grund für einen selektiven »Engpass«, in dem eine Version des Codes »einen derart selektiven Vorteil gegenüber allen ihren Konkurrenten gehabt hätte, dass sie als einzige überleben konnte«, wie Crick es formulierte. Wenn es aber keinen Engpass gab, so fragte sich Crick, warum koexistierten dann nicht mehrere Codes in verschiedenen Organismen?
Die naheliegendste Antwort ist die, dass alle Organismen auf der Erde von einem gemeinsamen Vorfahren abstammen, in dem der Code bereits fixiert war. Philosophischer ausgedrückt, entstand das Leben auf der Erde nur ein einziges Mal, wodurch es einzigartig und unwahrscheinlich erschien. Für Crick wies dies auf eine Infektion hin – eine Einmal-Impfung. Das Leben, so spekulierte er, wurde auf der Erde »ausgesät« wie ein bakterieller Klon, der von einem einzelnen extraterrestrischen Organismus stammte. Er ging sogar noch weiter und behauptete, dass Bakterien von einer außerirdischen Intelligenz absichtlich gesät wurden – von einem Raumschiff aus, das zur Erde geschickt wurde. Diese Vorstellung nannte er »gerichtete Panspermie«. Er entwickelte die Idee in dem Buch Life Itself, das 1981 veröffentlicht wurde. Matt Ridley sah es in seiner großartigen Biographie über Crick so: »Das Thema verwunderte nicht wenige. Der große Crick schreibt über außerirdische Lebensformen, die das Universum von einem Raumschiff aus besamen? Ist ihm der Erfolg zu Kopf gestiegen?«
Ob die Vorstellung eines Zufallscodes wirklich eine derart gewichtige Schlussfolgerung rechtfertigt, ist Ansichtssache. Der Code selbst muss nicht zwangsläufig bestimmte Vor- oder Nachteile mit sich bringen, um durch einen engen Flaschenhals zu passen. Eine starke Auslese zum Beispiel oder auch ein schwerer Unfall, wie der Einschlag eines Asteroiden, könnten alle bis auf einen einzigen Klon ausgelöscht haben und dieser hatte definitionsgemäß nur einen einzigen Code. Wie auch immer, Cricks Studie war unglücklich. Seit den frühen 1980er Jahren, als Crick seine Thesen verfasste, sind wir zu der Erkenntnis gekommen, dass der Code des Lebens weder eingefroren noch willkürlich ist. Der Code enthält versteckte Muster – ein »Code in den Codons« –, der uns einen Hinweis auf seine Ursprünge vor rund vier Milliarden Jahren gibt. Und wir wissen nun, dass der Code weit von der verächtlichen Geheimschrift entfernt ist, die von den Kryptographen verdammt wurde. Er ist ein Code unter einer Million, der dazu imstande ist, Veränderungen zu widerstehen und die Evolutionsgeschwindigkeit plötzlich zu beschleunigen.
*
Ein Code in den Codons! Seit den 1960er Jahren wurden verschiedene Muster in dem Code erkannt, jedoch wurden die meisten von ihnen schnell wieder verworfen. Sie waren kaum mehr als eine Kuriosität, reine statistische Störungen. Crick selbst sah es gewiss so. Auch im Zusammenhang gesehen, schien das gesamte Muster nur wenig Sinn zu ergeben. Warum es so wenig Sinn machte, ist eine gute Frage, die sich der kalifornische Biochemiker Brian K. Davis stellte. Er richtete schon seit Langem sein Forschungsinteresse auf die Wurzeln des genetischen Codes. Davis bemerkte, dass allein der Gedanke an einen »eingefrorenen Zufall« das Interesse an den Ursprüngen des Codes vertreibt: Warum einen Zufall erforschen? Zufälle passieren einfach. Daneben glaubte Davis, die wenigen Forscher, die noch Interesse zeigten, würden sich von der vorherrschenden Idee einer Ursuppe verleiten lassen. Wenn der Code seine Ursprünge in einer Suppe hatte, dann müssten seine tiefsten Wurzeln in den Molekülen liegen, die durch die physikalischen und chemischen Vorgänge in der Suppe höchstwahrscheinlich gebildet wurden. Und dies bedingte einen Kern aus Aminosäuren als Ausgangspunkt für den Code, an den später weitere Aminosäuren angefügt werden konnten. In dieser Vorstellung lag gerade noch genug Wahrheit für einen verlockenden Beweis, wenn auch ein irreführender. Nur, wenn wir den Code als das Produkt der Biosynthese betrachten – das Produkt von Zellen, die dazu fähig sind, aus Wasserstoff und Kohlendioxid ihre eigenen Bausteine herzustellen –, beginnen die Muster einen Sinn zu ergeben.
Welches sind nun also diese kaum erkennbaren Muster? Mit jedem Buchstaben des Triplett-Codes ist ein anderes Muster verknüpft. Der erste Buchstabe ist der eindrucksvollste, denn er steht mit den Arbeitsschritten in Verbindung, bei denen ein einfacher Ausgangsstoff in eine Aminosäure verwandelt wird. Das Prinzip ist so verblüffend, dass es eine kurze Erklärung wert ist. In heutigen Zellen werden Aminosäuren durch eine Reihe von biochemischen Schritten hergestellt, beginnend mit einigen unterschiedlichen einfachen Ausgangsstoffen. Überraschenderweise ist eine Verbindung zwischen dem ersten Buchstaben des Triplett-Codons und diesen einfachen Vorstufen zu beobachten. Demzufolge haben alle Aminosäuren, die aus dem Ausgangsstoff Pyruvat gebildet werden, denselben ersten Buchstaben in ihrem Codon – in diesem Fall ein T.5 Ich benutze Pyruvat als Beispiel, weil wir diesem Molekül bereits in Kapitel 1 begegnet sind. Es kann aus Kohlendioxid und Wasserstoff in hydrothermalen Quellen mithilfe dort auftretender katalysierender Minerale gebildet werden. Doch Pyruvat ist in dieser Hinsicht nicht alleine. Alle Aminosäurenvorstufen sind Teil der Biochemie des Zellkerns aller Zellen, nämlich ein Teil des Krebs-Zyklus, und müssten sich in dem Typ von Hydrothermalquellen bilden, der in Kapitel 1 beschrieben wurde. Die in diesem Punkt zugegebenermaßen schwache aber noch zu vertiefende Schlussfolgerung ist, dass es eine Verbindung zwischen den hydrothermalen Quellen und der ersten Position des Triplett-Codes geben muss.
Was ist mit dem zweiten Buchstaben? Hier liegt die Information, bis zu welchem Grad eine Aminosäure wasserlöslich oder -unlöslich ist, also ihre hydrophobe Eigenschaft. Hydrophile Aminosäuren lösen sich in Wasser, wogegen hydrophobe Aminosäuren nicht mischbar sind und sich in Fetten und Ölen lösen, wie die Lipidmembranen von Zellen. Die Aminosäuren können in ein Spektrum eingeordnet werden, das von »sehr hydrophob« zu »sehr hydrophil« reicht. In diesem Spektrum liegt die Verbindung zur zweiten Position des Triplett-Codes. Fünf der sechs häufigsten hydrophoben Aminosäuren haben ein T als mittlere Base, die häufigsten hydrophilen dagegen ein A, die dazwischenliegenden ein G oder C. Überall bestehen also stabile, zufallsunabhängige Beziehungen zwischen den ersten beiden Positionen eines jeden Codons und der codierten Aminosäure – aus welchem Grund auch immer.
Der letzte Buchstabe ist der Ort, an dem die Degeneration verankert ist – bei acht Aminosäuren eine (ein schöner Fachausdruck) vierfache Degeneration. Während die meisten Menschen sich eine vierfache Degenaration als einen torkelnden Betrunkenen vorstellen, der es schafft, in vier verschiedene Straßengräben zu fallen, meinen Biochemiker eigentlich nur, dass die dritte Position des Codons keine Information enthält: Es ist egal, welche Base dort sitzt, da alle vier Möglichkeiten dieselbe Aminosäure codieren. Im Falle von Glycin, welches beispielsweise von dem Triplett GGG codiert wird, kann das letzte G durch ein T, A oder C ausgetauscht werden – jedes Triplett codiert weiterhin Glycin.
Die Degeneration des Codes in der dritten Position hat einige interessante Konsequenzen. Wir haben bereits festgestellt, dass ein Doppelcode bis zu 16 von den 20 verschiedenen Aminosäuren codieren könnte. Wenn wir die fünf komplexesten Aminosäuren ausklammern (bleiben 15 plus ein Stopp-Codon), werden die Muster in den ersten beiden Buchstaben des Codes umso klarer. Es könnte daher sein, dass der ursprüngliche Code ein Doppelcode war und später einfach durch »Codon-Einfang« zu einem Triplett-Code erweitert wurde; die Aminosäuren konkurrierten untereinander um den dritten Platz. Wenn es sich so zugetragen hat, mögen die frühesten Aminosäuren einen »unfairen« Vorteil, was die »Übernahme« von Triplett-Codons angeht, gehabt haben und das scheint der Wahrheit zu entsprechen. Die 15 Aminosäuren beispielsweise, die höchstwahrscheinlich von dem frühen Doppelcode verschlüsselt wurden, eigneten sich untereinander 53 der 64 möglichen Tripletts an, im Durchschnitt 3,5 Codons pro Aminosäure. Im Gegensatz dazu versammelten die fünf »späteren« Zugänge lediglich acht Codons unter sich, was einen Durchschnitt von nur 1,6 ergibt. Es scheint offensichtlich, dass die frühen Vögel die Würmer gefangen haben.
So lassen Sie uns die Möglichkeit in Betracht ziehen, dass der Code anfangs ein Doppelcode und kein Triplett-Code war, der insgesamt 15 Aminosäuren verschlüsselte (plus ein »Stopp«-Codon). Dieser frühe Code war offenbar nahezu gänzlich plangesteuert, das heißt, er war durch physikalische und chemische Faktoren vorgeschrieben. Es gibt nur wenige Ausnahmen von der Regel, dass der erste Buchstabe mit dem Ausgangsstoff in Verbindung steht, während der zweite die Hydrophobie der Aminosäure bestimmt. Es gibt hier nur wenig Spielraum für jegliche Art von Zufall, keine Befreiung von den physikalischen Gesetzen.
Mit dem dritten Buchstaben verhält es sich jedoch anders. Hier war alles so flexibel, dass Spielraum für Zufälle vorhanden war und die Selektion dadurch die Möglichkeit hatte, den Code zu »optimieren«. Dies war jedenfalls in den späten 1990er Jahren die radikale Behauptung von zwei englischen Molekularbiologen – Lawrence Hurst und Stephen Freeland. Die beiden machten Wissenschaftsschlagzeilen, als sie den genetischen Code mit Millionen von zufälligen, am Computer generierten Codes verglichen. Sie berücksichtigten den Schaden, der durch Punktmutationen verursacht werden konnte, indem ein Buchstabe in einem Codon mit einem anderen vertauscht wird. Welcher Code, so überlegten sie, könnte solche Punktmutationen am besten abwehren, entweder indem er genau die gleiche Aminosäure beibehält oder sie durch eine ähnliche ersetzt? Sie fanden heraus, dass der echte genetische Code gegenüber Veränderungen überraschend resistent ist: Punktmutationen behalten oft ihre Aminosäuresequenz bei und im Falle einer Änderung neigen sie dazu, sie durch eine in ihrem Aufbau ähnliche zu ersetzen. Tatsächlich erklärten Hurst und Freeland den genetischen Code für besser als eine Million alternative, zufällig generierte Codes. Der Code ist einer unter einer Million und weit von der Torheit eines blinden, natürlichen Kryptographen entfernt. Er hält nicht nur Veränderungen stand, so sagen sie, sondern beschleunigt sogar die Evolution, indem er die katastrophalen Konsequenzen der auftretenden Veränderungen einschränkt: Mutationen sind offenkundig eher nutzbringend, wenn sie nicht katastrophal sind.
In Ermangelung eines überirdischen Entwurfs gibt es nur einen Weg, Optimierung zu erklären, und zwar über die Mechanismen der Selektion. In diesem Fall muss der Code des Lebens sich entwickelt haben. Zweifellos beweisen dies einige unbedeutende Variationen in dem »universellen« Code von Bakterien und Mitochondrien; insofern kann der Code sich entwickeln, wenn auch unter außergewöhnlichen Umständen. Aber wie konnte er sich verändern, ohne Chaos zu verursachen, mögen Sie sich, wie Crick, fragen? Die Antwort ist: diskret. Wird eine Aminosäure durch vier oder sogar sechs verschiedene Codons verschlüsselt, werden manche dazu neigen, häufiger als andere verwendet zu werden. Die selten benutzten Codons können praktisch für eine andere (aber vermutlich ähnliche) Aminosäure neu ausgewählt werden – ohne katastrophale Konsequenzen. Und so entwickelt sich der Code.
*
Alles in allem zeugt der »Code in den Codons« von einem physikalischen Prozess, der anfangs auf die Biosynthese und Löslichkeit von Aminosäuren beschränkt war und später erweitert und optimiert wurde. Die Frage ist, auf welchen physikalischen Prozess begann die Selektion einzuwirken?
Die Antwort ist ungewiss und enthält einige Stolpersteine. Das Henne-Ei-Problem zwischen DNA und Proteinen war eines der ersten, das auftauchte. Das Problem war, dass DNA mehr oder weniger reaktionsträge ist und sogar spezielle Proteine benötigt, um sich selbst zu replizieren. Andererseits werden spezielle Proteine nicht durch Zufall speziell. Sie entwickeln sich durch natürliche Selektion und damit dies passieren kann, muss ihre Struktur sowohl vererbbar als auch wandelbar sein. Proteine fungieren nicht als ihre eigene erbliche Vorlage: Sie werden von DNA codiert. Demzufolge können sich Proteine nicht ohne DNA entwickeln und DNA nicht ohne Proteine. Wenn keiner ohne den anderen entstanden sein kann, kann die Selektion niemals einsetzen.
Mitte der 1980er Jahre machte man schließlich die überraschende Entdeckung, dass RNA sich wie ein Katalysator verhält. RNA bildet nur selten eine Doppelhelix, stattdessen aber kleinere, kompliziert geformte Moleküle, die sich gegenseitig einander zur Katalyse bereitstellen. Und so durchbricht die RNA den Kreis. In einer hypothetischen »RNA-Welt« übernimmt sie gleichzeitig die Rolle von Proteinen und der DNA und katalysiert, neben vielen anderen Reaktionen, ihre eigene Synthese. Der Code war nun nicht mehr auf die DNA angewiesen: Er konnte sich durch direkte Wechselwirkungen zwischen RNA und Proteinen entwickeln.
In Bezug auf die Funktion moderner Zellen ergab dies durchaus einen Sinn. In heutigen Zellen gibt es keine direkten Wechselwirkungen zwischen DNA und Aminosäuren; jedoch werden bei der Proteinsynthese viele Basisreaktionen mithilfe von RNA-Enzymen, sogenannten Ribozymen, beschleunigt. Der Begriff »RNA-Welt« wurde durch Watsons Harvard-Kollegen Walter Gilbert geprägt, der ihn in einem der meistgelesenen Nature-Artikel, die jemals verfasst wurden, verwendete. Seine Idee hatte einen hypnotischen Effekt auf das gesamte Forschungsgebiet, da die Frage nun nicht mehr war, wie DNA Proteine codiert, sondern welche Wechselwirkungen zwischen RNA und Aminosäuren ablaufen. Die Antwort lag immer noch im Dunkeln.
Bei dem regen Interesse an der RNA-Welt ist es vielleicht verwunderlich, dass die katalytischen Fähigkeiten kleinerer RNA-Fragmente weitgehend ignoriert wurden. Wenn große RNA-Moleküle Reaktionen beschleunigen konnten, ist es wahrscheinlich, dass kleinere Bruchstücke – einzelne »Buchstaben« oder »Buchstaben«-Paare – ebenfalls dazu in der Lage waren, wenn auch weniger energisch. Neuere Untersuchungen des gefürchteten amerikanischen Biochemikers Harold Morowitz, der mit dem Molekularbiologen Shelley Copley und dem Physiker Eric Smith zusammenarbeitet, deuten auf genau diese Möglichkeit hin. Ihre Vorstellungen mögen nicht der Wahrheit entsprechen, aber ich denke, wir sollten ihre Theorie weiterverfolgen, um den Ursprung vom Code des Lebens zu finden.
Morowitz und seine Kollegen setzen voraus, dass Buchstabenpaare (fachsprachlich »Dinukleotide« genannt) als Katalysatoren fungierten. Sie stellten sich vor, dass sich ein Dinukleotid an die Vorstufe einer Aminosäure, wie beispielsweise Pyruvat, bindet und dessen Umwandlung in eine Aminosäure katalysiert. Welche Aminosäure genau gebildet wird, hängt von den Buchstaben ab, die in dem Dinukleotid gepaart vorliegen (und richtet sich nach dem Code in den Codons, den wir bereits besprochen haben). Im Wesentlichen legt der erste Buchstabe den Ausgangsstoff für die Aminosäure fest, der zweite die Art der Umwandlung. Ist das Buchstabenpaar beispielsweise UU, so formt sich Pyruvat und wird in die ziemlich hydrophobe Aminosäure Leucin umgewandelt. Morowitz stützt diese erfreulich einfache Idee auf einige raffinierte Reaktionsmechanismen, die sie letztendlich plausibel klingen lassen, obwohl ich gerne einige Beweise dafür in einem Reagenzglas sehen würde, dass seine angekündigten Reaktionen wirklich ablaufen können.
Um von hier aus zu einem Triplett-Code zu gelangen, sind, zumindest im Prinzip, lediglich zwei weitere Schritte nötig, die beide nur eine ganz normale Paarung von zwei Buchstaben voraussetzen. Im ersten Schritt bindet sich ein RNA-Molekül mittels Basenpaarung an das zweibuchstabige Dinukleotid: G an C, A an U und so weiter. Die Aminosäure wird auf die längere RNA übertragen, die stärkere Anziehungskräfte besitzt, je länger sie ist.6 Das Ergebnis ist eine RNA, die an eine Aminosäure gebunden ist, deren Identität wiederum von den Buchstaben des Dinukleotids abhängig ist. Im Grunde ist dies der Prototyp von Cricks »Adaptern« – eine RNA, die mit der »richtigen« Aminosäure beladen ist.
Im letzten Schritt wird ein Zwei-Buchstaben-Code in einen Drei-Buchstaben-Code überführt, wozu wieder nur eine normale Basenpaarung zwischen RNAs notwendig ist. Wenn solche Wechselwirkungen mit drei Buchstaben besser funktionieren als mit zwei (vielleicht, weil der Abstand günstiger oder die Bindungskraft stärker ist), tritt leicht eine Umschaltung auf einen Triplett-Code ein, in dem die ersten beiden Buchstaben von den Zwängen der Synthese festgelegt werden, während der dritte Buchstabe innerhalb gewisser Grenzen variieren kann, was eine spätere Optimierung des Codes erlaubt. Hier, so vermute ich, lag Crick mit seiner originellen Vorstellung von RNAs, die sich wie Ferkel an die Zitzen des Mutterschweins anschmiegen, möglicherweise richtig: Räumliche Grenzen könnten benachbarte RNAs auf ein »Mittel« von drei nebeneinanderliegenden Buchstaben zusammendrängen. Man beachte, dass bislang noch kein Leseraster, keine Proteine, sondern lediglich Aminosäuren vorliegen, die mit RNA in Wechselwirkung stehen. Die Grundlage des Codes ist jedoch bereits vorhanden und weitere Aminosäuren können später durch Einfangen freier Triplett-Codons aufgereiht werden.
Das ganze Szenario ist zu spekulativ, um gesichert zu sein, und bislang gibt es nur wenige Beweise, die es sichern könnten. Sein großer Vorteil ist, dass es Licht auf die Entstehung des Codes wirft und uns auf einem plausiblen und nachprüfbaren Weg von einfachen chemischen Verbindungen zu einem Triplett-Codon führt. Sie denken vielleicht, dass das zwar alles schön und gut ist, ich die RNA aber behandle, als ob sie auf Bäumen wachsen würde. Wenn wir schon dabei sind – wie gelangen wir von einfachen chemischen Verbindungen zur Selektion von Proteinen? Und wie von der RNA zur DNA? Tatsächlich gibt es darauf einige bemerkenswerte Antworten, die sich auf überraschende Erkenntnisse der letzten Jahre stützen. Erfreulicherweise stimmen diese neuen Erkenntnisse mit der Idee überein, dass sich das Leben in hydrothermalen Quellen entwickelt hat – dem Ort des Geschehens von Kapitel 1.
*
Die erste Frage lautet: Wo kam die ganze RNA her? Trotz zweier Jahrzehnte intensiver Untersuchung der RNA-Welt wurde diese Frage nur selten ernsthaft gestellt. Die unausgesprochene und, offen gesagt, unsinnige Annahme war, dass sie einfach irgendwie in einer Ursuppe »dasaß«.
Ich bin hier keineswegs höhnisch. In der Wissenschaft gibt es viele spezielle Fragestellungen, die nicht alle umgehend beantwortet werden können. Die traumhafte Aussagekraft der RNA-Welt beruht auf etwas »Gegebenem«: der ursprünglichen Existenz von RNA. Für die Pioniere der RNA-Welt war es nicht wichtig, wo die RNA herkam. Die Frage, die ihre Forschungen antrieb, war die: Was konnte sie tun? Sicherlich waren andere auch an der RNA-Synthese interessiert, aber sie spalteten sich in ewig streitende Gruppen, die sich ständig wegen ihrer favorisierten Hypothesen in den Haaren lagen. Vielleicht wurde RNA im Weltall aus Cyanid hergestellt; vielleicht bildete sie sich auf der Erde durch Blitze, die auf Methan und Ammoniak trafen; vielleicht wurde sie in einem Vulkan auf Katzengold geschmiedet. All diese Szenarien boten gewisse Vorteile, litten aber unter demselben Grundproblem – dem »Konzentrationsproblem«.
Es ist schwer genug, einzelne RNA-Buchstaben (Nukleotide) herzustellen, sie werden sich jedoch nur in einem Polymer (einem ordentlichen RNA-Molekül) vereinen, wenn die Nukleotide in hoher Konzentration vorhanden sind. Sind sie in großer Menge vorhanden, verbinden sich die Nukleotide spontan zu langen Ketten. Ist die Konzentration allerdings niedrig, geschieht das Gegenteil: RNA zerfällt wieder in ihre Bestandteile, die Nukleotide. Das Problem besteht darin, dass eine RNA jedes Mal, wenn sie sich selbst repliziert, Nukleotide aufnimmt und so deren Konzentration verringert. Sofern der Pool mit Nukleotiden nicht kontinuierlich aufgefüllt wird, und zwar schneller als er aufgebraucht wird, könnte die RNA-Welt niemals funktionieren – trotz ihrer großen Aussagekraft. Das geht nun gar nicht. So war es für diejenigen, die weiterhin produktive Forschung betreiben wollten, am besten, die RNA als etwas Gegebenes hinzunehmen.
Sie taten gut daran, denn eine Antwort ließ lange auf sich warten, bis sie sich schließlich auf dramatische Art und Weise abzeichnete. Es stimmt, dass RNA nicht auf Bäumen wächst, aber sie wächst in Schloten oder zumindest in simulierten Schloten. In seiner bedeutenden Arbeit aus dem Jahre 2007 berichtete der unermüdliche Geochemiker Mike Russell (dem wir bereits in Kapitel 1 begegnet sind), der zusammen mit Dieter Braun und dessen Kollegen in Deutschland forschte, dass sich riesige Mengen von Nukleotiden in Schloten ansammeln könnten. Der Grund dafür sind die ausgeprägten Temperaturgradienten, die sich dort entwickeln. Wir erinnern uns aus Kapitel 1 daran, dass basische hydrothermale Schlote von Poren durchsetzt sind, die miteinander verbunden sind. Temperaturgradienten erzeugen zwei Arten von Strömungen, die durch diese Poren zirkulieren – Konvektionsströme (wie in einem Teekessel) und Wärmediffusion (die Ableitung von Wärme in kälteres Wasser). Dazwischen verfüllen diese beiden Wärmeströmungen die unteren Poren nach und nach mit vielen kleinen Molekülen, darunter auch Nukleotiden. In ihrem simulierten hydrothermalen System überstieg die Konzentration der Nukleotide tausend- und sogar millionenfach die Ausgangskonzentration. Derart hohe Konzentrationen sollten ganz bequem Nukleotide zu RNA- oder DNA-Ketten zusammenführen. Die Autoren schlossen daraus, dass solche Bedingungen »einen überzeugenden, hochkonzentrierten Ausgangspunkt für die molekulare Evolution des Lebens« darstellten.
Aber das ist noch nicht alles, was die Schlote können. Längere RNA- oder DNA-Moleküle häufen sich theoretisch stärker an als einzelne Nukleotide: Mit ihrer größeren Größe sind sie besser dazu geeignet, die Poren zu verfüllen. DNA-Moleküle, die aus 100 Basenpaaren bestehen, reichern sich, vermutlich mit einem Millionen-Milliardenfachen der Ausgangskonzentration, außerordentlich gut an. Solch hohe Konzentrationen sollten im Prinzip jegliche Wechselwirkungen ermöglichen, die wir besprochen haben, wie die Bindung von RNA-Molekülen aneinander und so weiter. Was noch besser ist – Temperaturschwankungen (thermische Spannungen) treiben die RNA-Replikation ebenso an wie die bewährte Labormethode PCR (polymerase chain reaction), die Polymerase-Kettenreaktion. Bei der PCR wird die DNA durch hohe Temperaturen aufgetrennt, wodurch sie als Kopiervorlage dienen kann. Kühlere Temperaturen erlauben dagegen die Polymerisation des Komplementärstranges. Das Ergebnis ist eine exponentielle Replikationsrate.7
Zusammenfassend betrachtet, müssten infolge der Temperaturgradienten in den Schloten einzelne Nukleotide in hohen Konzentrationen angereichert werden und die Bildung von RNA vorantreiben. Anschließend müsste durch die gleichen Gradienten RNA angereichert werden, die die physikalischen Wechselwirkungen zwischen den Molekülen unterstützt. Letztendlich sollten die Temperaturunterschiede die Replikation der RNA beschleunigen. Es ist schwer, sich einen besseren Ort für die ursprüngliche RNA-Welt vorzustellen.
Was ist nun mit unserer zweiten Frage, wie wir von sich replizierenden RNAs, die mit sich selbst um die Wette eifern, zu einem hochentwickelteren System gelangen, in dem RNA beginnt, Proteine zu codieren? Wieder mögen die Schlote die Antwort parat halten.
Geben Sie RNA zusammen mit den nötigen Rohmaterialien und Energie (in Form von ATP) in ein Reagenzglas und sie wird sich replizieren. Tatsächlich wird sie sich nicht nur replizieren, sondern sie wird entstehen, wie der Molekularbiologe Sol Spiegelman und seine Kollegen in den 1960er Jahren herausfanden. Über Reagenzglasgenerationen hinweg repliziert sich die RNA schneller und schneller und wird letztendlich enorm effizient. Sie wurde zu Spiegelmans Monster – ein produktiver, sich replizierender RNA-Strang, der lediglich zu einem künstlichen und rasenden Dasein fähig ist. Kurioserweise ist es unwichtig, wo der Ausgangspunkt liegt: Sie können mit einem ganzen Virus oder mit einer unnatürlich langen RNA beginnen. Sie können sogar mit einer Mischung aus Nukleotiden und einer Polymerase beginnen, um diese gemeinsam aufzuziehen. Wo Sie auch starten, es besteht immer eine Tendenz dazu, das gleiche »Monster« zu erschaffen, denselben, sich frenetisch replizierenden RNA-Strang, kaum 50 Buchstaben lang – Spiegelmans Monster. Es ist ein molekularer Murmeltiertag.
Die Sache ist die, dass Spiegelmans Monster nicht komplexer wird. Der Grund, weshalb es auf einer Strecke von 50 Buchstaben stehenbleibt, ist, dass dies die Bindungssequenz für das Replikase-Enzym ist, ohne das sich der Strang überhaupt nicht replizieren könnte. Die RNA kann gewissermaßen nicht über den eigenen Tellerrand schauen und wird in einer Lösung niemals Komplexität entwickeln. Wie und warum begann die RNA nun, auf Kosten ihrer eigenen Replikationsgeschwindigkeit, Proteine zu codieren? Der einzige Ausweg aus diesem Teufelskreis ist, dass die Selektion auf einer »höheren Stufe« erfolgt und die RNA Teil eines größeren Ganzen wird, das nun die Einheit der Selektion darstellt – beispielsweise eine Zelle. Das Problem besteht darin, dass alle organischen Zellen viel zu komplex sind, um einfach so, ohne Evolution, in Erscheinung zu treten, was bedeutet, dass für die Merkmale einer Zelle, viel mehr noch als für die Replikationsgeschwindigkeit der RNA, Selektion eintreten muss. Dies ist eine Henne-Ei-Situation – genauso unvermeidlich wie der DNA-Protein-Teufelskreis, wenn auch weniger berühmt.
Wir haben gesehen, dass RNA den DNA-Protein-Teufelskreis erfreulicherweise durchbricht; doch was durchbricht den Teufelskreis der Selektion? Die Antwort sticht uns direkt ins Auge: Es sind die gebrauchsfertigen anorganischen Zellen in den Hydrothermalquellen. Solche Zellen besitzen dieselbe Größe wie organische Zellen und werden in aktiven Schloten ständig gebildet. Sind die Organellen einer Zelle also besonders gut darin, die Rohmaterialien zu erneuern, die für ihre eigene Replikation benötigt werden, beginnt die Zelle sich selbst zu replizieren und bildet Knospen neuer anorganischer Zellen. Im Gegensatz dazu werden »egoistische« RNAs, die sich so schnell wie möglich selbst replizieren, verdrängt, da sie nicht in der Lage sind, die Rohmaterialien zu erneuern, die sie zur Fortsetzung ihrer eigenen Replikation brauchen.
Mit anderen Worten verschiebt sich in der Umgebung der Schlote die Selektion graduell von der Replikationsgeschwindigkeit einzelner RNA-Moleküle hin zum allgemeinen »Stoffwechsel« der Zellen, die als individuelle Einheiten funktionieren. Und vor allen anderen sind die Proteine die Meister des Stoffwechsels. Es war unvermeidlich, dass sie letztendlich die RNA ersetzen würden. Selbstverständlich entstanden Proteine nicht ganz plötzlich; wahrscheinlich trugen Minerale, Nukleotide, RNAs, Aminosäuren und Molekülkomplexe (beispielsweise Aminosäuren, die an RNA gebunden waren) zum Prototyp eines Stoffwechsels bei. Was als einfache Verschmelzung von Molekülen begann, wurde in dieser Welt aus sich natürlich vermehrenden Zellen zur Selektion der Fähigkeit, die Bestandteile ganzer Zellen zu erneuern. Es wurde zur Selektion der Selbstversorgung und letztlich eines unabhängigen Daseins. Und ironischerweise finden wir in dem unabhängigen Dasein der heutigen Zellen den letzten Schlüssel zum Ursprung der DNA.
*
Zwischen Bakterien gibt es einen tiefen Riss, dessen große Bedeutung für unsere eigene Evolution wir in Kapitel 4 erkennen werden. Vorerst betrachten wir nur seine Auswirkungen auf die Entstehung der DNA, die an sich schon tiefgründig genug sind. Der Riss trennt die Eubakterien (aus dem Griechischen für »echte« Bakterien) von einer zweiten Gruppe, die praktisch genauso aussieht. Diese zweite Gruppe ist unter dem Namen Archaebakterien oder einfacher Archaeen bekannt. Ihr Name leitet sich von der Vorstellung ab, dass sie besonders archaisch oder altertümlich sind, obwohl heute kaum noch jemand glaubt, sie seien älter als die echten Bakterien.
Tatsächlich könnten Bakterien und Archaeen durch einen glücklichen Zufall, der an das Unglaubliche grenzt, aus demselben hydrothermalen Hügel hervorgegangen sein. Kaum etwas anderes kann die Tatsache erklären, dass sie den gleichen genetischen Code tragen und auch viele Gemeinsamkeiten bei der Proteinsynthese zeigen, jedoch offenbar erst später lernten, ihre DNA vollkommen selbstständig zu vervielfältigen. Während die DNA und der genetische Code sicherlich nur einmal entstanden sind, entwickelte sich die Replikation der DNA – der physikalische Mechanismus der Vererbung in allen lebenden Zellen – offensichtlich zweimal.
Wenn eine derartige Behauptung von einem Geringeren als Eugene Koonin käme, einem akribischen und klugen, in Russland geborenen amerikanischen Spezialisten für computergestützte Genetik an den National Institutes of Health in den USA, würde ich dafür plädieren, sie anzuzweifeln. Koonin und seine Kollegen legten es aber gar nicht darauf an, eine radikale Idee zu beweisen. Sie stolperten im Zuge einer systematischen Untersuchung der DNA-Replikation in Bakterien und Archaeen darüber. Mithilfe eingehender Vergleiche von Gensequenzen fanden Koonin und seine Kollegen heraus, dass Bakterien und Archaeen weitgehend dieselben Mechanismen bei der Proteinsynthese anwenden. Beispielsweise ist die Art und Weise, wie DNA in RNA eingelesen und anschließend RNA in Proteine übertragen wird, im Grunde ähnlich. Sowohl Bakterien als auch Archaeen benutzen dazu Enzyme, die sie (ihren Gensequenzen zufolge) offensichtlich von einem gemeinsamen Vorfahren geerbt haben. Dies trifft jedoch nicht auf die Enzyme zu, die für die Replikation der DNA benötigt werden. Die meisten von ihnen haben rein gar nichts gemeinsam. Diese kuriose Sachlage kann einfach mit ihrer grundlegenden Verschiedenheit erklärt werden, jedoch tut sich dann die Frage auf, weshalb die ebenso grundlegenden Unterschiede zwischen DNA-Abschrift und -Übertragung nicht zu einer ebensolchen völligen Ungleichheit führten. Die einfachste Erklärung liefert Koonins eigene, radikale Vermutung: Die DNA-Replikation entwickelte sich zweimal – einmal in den Archaeen und einmal in den Bakterien.8
Eine solche Behauptung muss vielen hanebüchen erschienen sein, für einen brillanten und liebenswert »störrischen« Texaner, der in Deutschland arbeitete, war sie jedoch einfach nur das, was der Arzt angeordnet hatte. Der Biochemiker Bill Martin, dem wir bereits in Kapitel 1 begegnet sind, hatte sich bereits mit Mike Russell zusammengetan, um die Ursprünge der Biochemie in hydrothermalen Quellen zu erforschen. Im Widerspruch zur gängigen Meinung verfassten sie 2003 ihre eigene Theorie: Der gemeinsame Vorfahr von Bakterien und Archaeen war keineswegs ein freilebender Organismus, sondern ein mittelmäßiger Replikator, der an löchriges Felsgestein gebunden war und die mineralischen Zellen, die die heißen Hügel durchsiebten, noch nicht verlassen hatte. Um ihre Aussage zu untermauern, fertigten Martin und Russell eine Liste mit weiteren abgrundtiefen Unterschieden zwischen Bakterien und Archaeen an. Insbesondere ihre Zellmembranen und -wände sind völlig verschieden und deuten darauf hin, dass sich die beiden Gruppen unabhängig voneinander innerhalb derselben steinigen Grenzen entwickelt haben. Vielen war diese Annahme zu radikal, für Koonin jedoch passte sie wie angegossen zu den Beobachtungen.
Martin und Koonin steckten alsbald ihre Köpfe zusammen, um über den Ursprung von Genen und Genomen in hydrothermalen Quellen nachzudenken. Ihr anregender Gedankenaustausch zu diesem Thema wurde 2005 veröffentlicht. Sie nahmen an, dass der »Lebenszyklus« mineralischer Zellen dem moderner Retroviren, wie HIV, ähnelte. Retroviren besitzen ein winziges Genom, das sich lieber in der RNA als in der DNA verschlüsselt. Wenn sie eine Zelle befallen, kopieren Retroviren ihre RNA in DNA, wobei sie ein Enzym namens »reverse Transkriptase« benutzen. Die neue DNA wird zunächst in das Genom des Wirtes eingebaut und dann zusammen mit den eigenen Genen der Wirtszellen eingelesen. Bei der Herstellung zahlreicher Kopien arbeitet das Virus also von der DNA aus; während es sich selbst für die nächste Generation verpackt, verlässt es sich jedoch auf die RNA, um die Erbinformation zu übermitteln. Was ihm bemerkenswerterweise fehlt, ist die Fähigkeit DNA zu replizieren, was üblicherweise eine ziemlich mühselige Prozedur darstellt, für die zahlreiche Enzyme benötigt werden.
Ein solcher Lebenszyklus hat Vor- und Nachteile. Der große Vorteil ist die Geschwindigkeit. Mit der Übernahme eines Wirtszellenmechanismus für die Übertragung von DNA in RNA und der Übersetzung der RNA in Proteine entledigen sich Retroviren von dem Bedürfnis nach einer großen Anzahl von Genen und ersparen sich damit eine ganze Menge Zeit und Ärger. Der große Nachteil besteht darin, dass sie in ihrer Existenz vollkommen von »echten« Zellen abhängig sind. Ein zweiter, weniger offensichtlicher Nachteil ist die geringe Speicherkapazität der RNA im Vergleich zur DNA. Sie ist chemisch instabiler als DNA, sprich reaktionsfreudiger und katalysiert letztendlich auf diese Weise biochemische Reaktionen. Diese Reaktionsfähigkeit hat allerdings auch zur Folge, dass große RNA-Genome instabil sind und zusammenbrechen, was ein maximales Größenlimit bedingt, das weit unter dem für eine unabhängige Existenz erforderlichen liegt. Ein Retrovirus ist in der Tat bereits fast so komplex, wie es eine RNA-codierte Funktionseinheit sein kann.
Jedoch nicht in mineralischen Zellen. Diese bieten zwei Vorteile, die die Entwicklung komplexerer RNA-Lebensformen ermöglichen. Der erste ist der, dass viele der Eigenschaften, die für ein unabhängiges Leben benötigt werden, in den Schloten kostenlos zur Verfügung stehen und den Zellen einen gewissen Vorsprung geben: Die wuchernden Mineralzellen stellen bereits begrenzende Membranen, Energie und so weiter bereit. In gewisser Weise sind die sich selbst replizierenden RNAs, die die Schlote besiedeln, also schon »viral«. Der zweite Vorteil ist, dass sich RNA-»Schwärme« fortwährend mischen und durch die miteinander in Verbindung stehenden Zellen passen; Gruppen, die gut miteinander »kooperieren«, können sich zusammenfinden, indem sie sich gemeinsam ausbreiten, um neu gebildete Zellen zu besiedeln.
So stellten sich Martin und Koonin Populationen kooperativer RNAs vor, die mineralischen Zellen entsprangen, wobei jede RNA eine Handvoll verwandter Gene codierte. Der Nachteil an diesem Arrangement ist sicherlich, dass die RNA-Populationen anfällig dafür wären, sich erneut in andere, möglicherweise ungeeignete Verbindungen zu mischen. Eine Zelle, die es schaffen würde, ihr »Genom« zusammenzuhalten, indem sie eine Gruppe kooperativer RNAs in ein einzelnes DNA-Molekül konvertiert, würde all ihre Vorteile behalten. Ihre Replikation würde dann der eines Retrovirus ähneln – ihre DNA würde in einen RNA-Schwarm überschrieben werden, der benachbarte Zellen infiziert und ihnen dieselbe Fähigkeit verleiht, nämlich Informationen wieder in einer DNA-Bank abzulegen. Jeder neue Wirrwarr an RNAs würde frisch von dieser Bank geprägt werden und wäre somit weniger wahrscheinlich von Fehlern durchsetzt.
Wie schwer dürfte es für die mineralischen Zellen gewesen sein, unter diesen Umständen DNA zu »erfinden«? Vermutlich nicht sehr – jedenfalls wesentlich leichter, als ein ganzes System für die Replikation von DNA (anstelle von RNA) zu erfinden. Zwischen RNA und DNA gibt es lediglich zwei winzige chemische Unterschiede, zusammen bewirken diese allerdings einen gewaltigen Strukturunterschied: den Unterschied zwischen den spiralförmigen, katalytischen Molekülen der RNA und der DNA-Doppelhelix mit Symbolcharakter (wie sie Crick und Watson bereits zufällig 1953 in ihrem ursprünglichen Nature-Beitrag vorausgesagt hatten).9 Nur schwer würden diese beiden winzigen Veränderungen, die an den Schloten nahezu spontan auftreten, zu stoppen sein. Die erste ist die Entfernung eines einzelnen Sauerstoffatoms aus der RNA (Ribonukleinsäure), um eine Desoxyribonukleinsäure oder DNA zu erzeugen. Diese Reaktion läuft auch heute über die reaktionsfreudigen (fachsprachlich frei-radikalen) Zwischenprodukte ab, die in den Schloten angetroffen wurden. Die zweite Veränderung ist die Anlagerung einer »Methyl«-(CH3)-Gruppe an die Nukleinbase Uracil, wodurch Thymin gebildet wird. Methylgruppen sind ebenfalls reaktionsfreudige, frei-radikale Abspaltungen von Methangas, die in basischen Schloten reichlich vorhanden sind.
Die Erstellung der DNA könnte demzufolge relativ einfach gewesen sein: Sie müsste sich genauso »spontan« in den Schloten gebildet haben wie die RNA. (Ich will damit sagen, ihre Entwicklung aus einfachen Vorstufen müsste durch Minerale, Nukleotide, Aminosäuren und so weiter katalysiert worden sein.) Ein etwas schwierigerer Kunstgriff dürfte es gewesen sein, die codierte Information zu sichern, also eine exakte Kopie der RNA-Buchstabensequenz in DNA-Form zu erstellen. Doch auch diese Schwierigkeit ist überwindbar. Um RNA in DNA zu konvertieren, wird lediglich ein Enzym benötigt: eine reverse Transkriptase, wie sie heute von Retroviren, wie HIV, treuhänderisch verwaltet wird. Ironischerweise soll ausgerechnet das Enzym, welches den zentralen Glaubenssatz der Molekularbiologie »bricht« – DNA macht RNA macht Protein –, das Enzym sein, welches einen löchrigen, von viraler RNA befallenen Felsen zum Leben erweckte, wie wir es heute kennen! Möglicherweise verdanken wir die ursprüngliche Geburt der Zellen diesem bescheidenen Retrovirus.
Vieles in dieser Erzählung bleibt offen. Viele Ungereimtheiten wurden bei dem Versuch, eine Geschichte zu rekonstruieren, die einen gewissen Sinn ergibt, übersprungen – zumindest in meinen Augen. Ich kann nicht vortäuschen, dass alle Beweise, die wir hier diskutiert haben, endgültig oder viel mehr sind als nur Schlüssel zur tiefsten Vergangenheit. Sie sind jedoch echte Schlüssel, die mithilfe der Theorie gedeutet werden müssen, die letzten Endes die richtige ist. Im Code des Lebens gibt es tatsächlich Muster – Muster, die auf eine Zusammenarbeit zwischen Chemie und Selektion hinweisen. In Tiefseeschloten reichern sich durch thermische Strömungen wirklich Nukleotide, RNA und DNA an; die siebartigen Mineralzellen der Schlote stellen eine perfekte RNA-Welt dar. Und es gibt in der Tat große Unterschiede zwischen Archaeen und Bakterien – Unterschiede, die nicht einfach mit einer Handbewegung weggezaubert werden können. Sie deuten mit Sicherheit darauf hin, dass das Leben mit einem retroviralen Zyklus begann.
Ich bin wahrhaft begeistert davon, dass sich die Geschichte, die wir hier enträtselt haben, wirklich so zugetragen haben könnte. Eine große Ungewissheit behalte ich jedoch im Hinterkopf: die Schlussfolgerung, dass sich zelluläres Leben zweimal aus den Tiefseeschloten entwickelt hat. Infizierten RNA-Schwärme benachbarte Schlote, nahmen letztendlich weite Teile des Ozeans ein und ermöglichten es der Selektion weltweit zu wirken? Oder waren die außergewöhnlichen Bedingungen in einem bestimmten Schlotsystem besonders günstig, sodass dort sowohl Archaeen als auch Bakterien entstehen konnten? Vielleicht werden wir es niemals erfahren; das Zusammenspiel von Zufall und Notwendigkeit sollte uns jedoch alle zum Nachdenken anregen.