Magazin der Universit?t Z?rich Nr. 1/96

Die Sprache der Gene

VON HANS WEBER

Jede lebende Zelle, ob im Blütenblatt einer Rosenknospe, in unserer grauen Gehirnsubstanz oder als bescheidenes Bakterium im Dickdarm befindlich, benötigt für die Organisation ihrer vielfältigen stofflichen Umsetzungen einen regen Informationsfluss. Die Information stammt zum grossen Teil aus dem Zellkern, wo auf der Erbsubstanz der Chromosomen eine Art Bibliothek – man könnte auch sagen: eine Datenbank – gelagert ist, aus der die zu jeder Zeit benötigten Dokumente abgerufen werden. Die komplexe «Sprache», welche die Zellen für diese Informationsspeicherung und Übermittlung verwenden, ist der zentrale Gegenstand der Genforschung. Sie weist für alle irdischen Lebewesen eine ähnliche Grundstruktur und das gleiche Basisvokabular auf und zeigt überraschende Ähnlichkeiten mit einer gesprochenen menschlichen Sprache.

GenomStele des Hammurapi Abbildung 1 (links):
Die Basensequenz des Genoms des menschlichen Hepatitis-B-Virus.

Abbildung 2 (rechts):
Der Gesetzescodex von Hammurapi, König von Babylon 1792-1750 v. C. (Ausschnitt).

Dieser Textbeitrag besteht, Abstände inbegriffen, aus genau 10 892 Zeichen; die Redaktion hatte mir 10 000 zugestanden. In Abbildung 1 ist in verkleinerter Form ein kürzerer, aber weit bedeutungsschwererer Text wiedergegeben: Es handelt sich um die 3182 «Zeichen», welche unter Verwendung des Vier-Buchstaben-Alphabets A, C, G, T die Erbinformation des menschlichen Hepatitis-B-Virus bilden. Sie befinden sich auf einem Molekül der Erbsubstanz Deoxyribonukleinsäure (DNA), verpackt in einem protein- und lipidhaltigen Viruspartikel. Durch Blut- oder Schleimhautkontakte in den Körper gelangt, finden diese Viren ihren Weg zur Leber und dringen in deren Zellen ein. Die eingeführte Textinformation bewirkt in den infizierten Leberzellen, dass viele neue Textkopien hergestellt, in neu aufgebaute, infektiöse Viren verpackt und aus der Zelle ausgeschieden werden. Diese Vorgänge sind mit einer Zellschädigung verbunden. Weltweit sind schätzungsweise 300 Millionen Menschen durch Infektion mit Hepatitis-B-Virus zu Trägern und Überträgern dieser «Botschaft» geworden. Viele davon erkrankten an akuter Leberentzündung (Gelbsucht), viele leiden an chronischer Hepatitis, welche oft zu Leberzirrhose oder zu Leberkrebs führt. Letzterer ist infolge der hohen Infektionshäufigkeit in den Ländern Südasiens eine der häufigsten Todesursachen.

Ist diese Sprache lernbar?

Dass heute solche Texte – und auch tausendfach längere – gelesen und in ihren Grundzügen verstanden werden können, ist das Ergebnis der wahrhaft atemraubenden Entwicklung der Molekularbiologie im Laufe des letzten halben Jahrhunderts. Erst 1943 war das biologische Trägermaterial der Erbinformation im Laboratorium von Oswald T. Avery als DNA identifiziert worden. Von da an folgten sich die Erkenntnissprünge im Zehnjahresrhythmus. 1953 entdeckten James D. Watson und Francis H. C. Crick die Doppelhelixstruktur der DNA, welche deutlich machte, dass die Erbinformation tatsächlich schriftähnlich in der linearen Reihenfolge der vier Basen Adenin, Cytosin, Guanin und Thymin (abgekürzt A, C, G und T) auf der DNA niedergelegt ist. Bis Mitte der sechziger Jahre war dann der «Genetische Code» entschlüsselt, das heisst, das für den Aufbau der Proteine (Eiweisse) geltende Grundvokabular, welches jeweils drei aufeinanderfolgende Basen oder Buchstaben einem der 20 verschiedenen Proteinbausteine (Aminosäuren) zuordnet.

Einen gewaltigen Erkenntnisfortschritt ermöglichte Mitte der siebziger Jahre die Entwicklung der Gentechnologie. Sie erlaubte erstmals die Isolierung einer grossen Anzahl von Genen, das heisst von Textabschnitten, welche den Aufbau von Zellbestandteilen meist von Proteinen bestimmen. Die gleichzeitige Entwicklung von schnellen Methoden zur Bestimmung von Basenreihenfolgen («Sequenzen») verschaffte Zugang zu einer breiten Auswahl genetischer Texte aus den verschiedensten Organismen. Die achtziger Jahre brachten wichtige Erkenntnisse zu Fragen der Gen-Regulation, nämlich der hierarchischen Verhältnisse und der Vernetzungen von Genen und ihren Steuerungssignalen untereinander, einem Bereich, den man auch als «Syntax» der genetischen Sprache umschreiben könnte.

Seit kurzem schliesslich wurde es möglich, den Blick auf das gesamte Genom eines Organismus zu richten, das heisst auf die Gesamtheit seiner genetischen Information. Als vorläufiger Höhepunkt erfolgte 1995 die erstmalige Bestimmung der gesamten Basensequenz eines zellulären Organismus, nämlich des Bakteriums Haemophilus influenzae, mit 1 830 137 Basen. Damit ist es also prinzipiell möglich geworden, die gesamten biologischen Textwerke einzelner Organismen im Zusammenhang zu studieren. Die Annahme ist nicht unrealistisch, dass bis in nochmals zehn Jahren das Genom des Menschen mit seinen schätzungsweise drei Milliarden Basenpaaren ebenfalls vollständig bekannt sein wird.

Kann manüberhaupt von «Sprache» reden?

Genetische Texte werden zwar nicht gesprochen, und eine phonetische Wiedergabe der Buchstaben von Abbildung 1 dürfte auf Schwierigkeiten stossen. Von mit der Biologie weniger Vertrauten ist gelegentlich die Meinung zu hören, genetische Information erschöpfe sich in dem bereits erwähnten, eher trivialen «Genetischen Code», der die Reihenfolge der Aminosäuren in den Proteinen festlegt. Wenn diese Ansicht zuträfe, wären alle Fragen zur genetischen Information schon seit dreissig Jahren vollumfänglich gelöst! Tatsächlich liegt der Anteil der für Proteine codierenden DNA zum Beispiel im menschlichen Genom nur bei schätzungsweise fünf Prozent. Die Funktion des Genoms in den Zellen eines Organismus lässt sich aber in gewissem Sinne vergleichen mit der Rolle einer Sammlung von Verfassungs- und Gesetzesschriften, welche die Organisation einer Gemeinde oder eines Staates festlegen (als Beispiel in Abbildung 2: Der Hammurapi-Codex). Genomische Texte enthalten nämlich nicht nur ein Inventar der Proteine, sondern bestimmen auch den Umfang und den zeitlichen Ablauf ihres Aufbaus, ihres Transports und ihrer Entsorgung und damit auch der meisten andern Zellkomponenten. Sie ermöglichen und koordinieren intensive Material- und Informationsflüsse, sowohl im Innern der Zelle als auch mit der Aussenwelt. Je nach Umweltsituation (zum Beispiel bezüglich Nährstoffe, Temperatur, Salzkonzentration oder Schadstoffe) werden Prioritäten gesetzt und Massnahmenpläne aktiviert, Schutzvorkehrungen getroffen und Reparaturvorgänge eingeleitet. Genetische Information regelt und koordiniert auch die Zellvermehrung und Zelldifferenzierung in mehrzelligen Organismen, und Störungen dieser Informationsübertragung sind bekanntlich die Ursache für das krebsartige Wachstum von Geweben.

Für diese komplexen Aufgaben des biologischen Informationssystems wäre ein einfacher Code oder auch eine einfache, eindeutige Computersprache nicht ausreichend. Mit den gesprochenen menschlichen Sprachen teilt die genetische Sprache zum Beispiel die Eigenschaft der Redundanz, die dafür sorgt, dass bei fehlerhafter Übermittlung oder Verlust von einzelnen Textteilen die Information oft aus dem Kontext erkennbar bleibt.Ähnlich wie menschliche Sprachen ist genetische Informationübrigens auch kontextabhängig, nämlich in dem Sinne, dass viele Worte oder Signale an sich mehrdeutig sind und erst aus dem Kontext, das heisst aus benachbarten oder entfernteren Textbereichen, ihre genaue Bedeutung erkennbar wird.

Genetische Texte zeichnen sich ferner vielleicht in noch höherem Mass als Sprachtexte dadurch aus, dass in der Regel mehrere Bedeutungsebenen zu berücksichtigen sind und dass sich mehrere ineinander verschachtelte Botschaften an verschiedene Empfänger richten können. Besondere Meister im derartigen Komprimieren von Information findet man im Reich der Viren. Für viele Viren ist es von Vorteil, wenn sie ihren Informationsgehalt möglichst kurz fassen, weil kurze Botschaften leichter korrekt kopiert und sicher verpackt werden können. In der in Abbildung 1 wiedergegebenen Basensequenz des Hepatitis-B-Virus sind sogar Codierungen für verschiedene Proteine einanderüberlagert! Trotzdem erscheint es bemerkenswert, dass ein so winziger Text im menschlichen Organismus, dessen Erbinformation eine Million Mal umfangreicher ist, derartig verheerende Wirkungen entfalten kann.

Brauchen wir das alles wirklich zu wissen?

Die Frage wurde mir von einem bekannten Physiker tatsächlich gestellt. Ich gab ihm zu bedenken, dass die genetische Information das einzige komplexe, sprachähnliche Informationsspeicherungs- und Übermittlungssystem auf unserem Planeten darstellt, das nicht durch Menschen, sondern durch die belebte Natur selber seit ihren frühesten Anfängen entwickelt worden ist. Dabei verwenden alle bekannten Organismen das gleiche Grundvokabular – den «Genetischen Code» – und die selben Grundzüge der Syntax, was stark darauf hindeutet, dass alles irdische Leben von einem einzigen Ur-Organismus abstammen muss. Die unterschiedlichen Ausprägungen der verschiedenen Organismen verhalten sich zueinander etwa wie verschiedene Dialekte derselben Sprache und erlauben eine Einordnung der Arten nach Verwandtschaftsgraden. Wie könnten wir, solange wir uns für die belebte Natur interessieren, auf die Kenntnis dieser Sprache verzichten wollen? Dabei ist es selbstverständlich, dass Lebewesen nicht auf ihre genetische Information zu «reduzieren» sind und andere, wichtige Ansätze zu ihrem Studium ebenfalls verfolgt werden müssen. Aber ein Verzicht auf das Genom als Wissensquelle wäre wohl etwa gleich sinnlos wie zum Beispiel die Vorstellung, die Geschichtsforschung könnte auf die Verwendung schriftlicher Quellen verzichten.

Was nützt diese Forschung?

Über die Auswirkungen naturwissenschaftlicher Erkenntnisschübe im Bereich praktischer Anwendungen besteht bekanntlich in weiten Kreisen Unsicherheit und Misstrauen. Für Neuerungen, die ein derartiges Potential zu Eingriffen in menschliche Lebensgrundlagen mit sich bringen, sind zweifellos besonders hohe ethische Massstäbe und Verantwortungsbewusstsein unabdingbar. Die Auseinandersetzungen um diese Problematik sind bekannt; sie werden längst in der politischen Arena ausgetragen, und es ist hier nicht der Ort, darauf näher einzugehen. Eine Meinungsäusserung sei mir immerhin gestattet, nämlich, dass es kaum Zeichen eines hohen Verantwortungsbewusstseins wäre, aus Furcht vor vorstellbaren unerwünschten auch reale und unbestreitbar erwünschte Anwendungen zu verunmöglichen. Dass nützliche Anwendungen der Gentechnologie möglich und real sind, dafür bietet gerade das oben gezeigte Genom des Hepatitis-B-Virus ein gutes Beispiel. Teile dieser Basensequenz konnten dazu verwendet werden, auf gentechnischem Weg einen Impfstoff herzustellen, der infolge seiner Ungefährlichkeit, Verfügbarkeit und Stabilität erstmals zur Durchführung von Massenimpfungen geeignet ist. Solche Impfkampagnen sind in Südasien bereits im Gang, und es besteht die berechtigte Hoffnung, dass damit eines der schwerwiegendsten Gesundheitsprobleme dieser Weltregion einer Lösung näherkommen wird. Mehrere weitere Beispiele, wie genetisches Wissen für sinnvolle Anwendungen eingesetzt werden kann, sind in den nachfolgenden Beiträgen dieses Magazins beschrieben. Einer davon befasst sich mit Alpha-Interferon, einem der ersten menschlichen Proteine, die in Bakterien hergestellt werden konnten. Es leistet heute ebenfalls einen Beitrag zur Bekämpfung der infektiösen Hepatitis-Erkrankungen, indem es einen der wenigen Wirkstoffe darstellt, die Erfolge bei der Behandlung von Hepatitis B und C erzielen.

Über die Erwägungen der Nützlichkeit von Anwendungen hinaus gilt es hier aber auch, eine ganz andere Art von Gewinn hervorzuheben: Nämlich dieüberwältigenden Einblicke in die komplexe Organisation der lebenden Natur, welche das Studium der Sprache der Gene uns verschafft, und das tiefe Erstaunen darüber in jedem Menschen, dem das Privileg zuteil wird, sich damit näher befassen zu können.


Dr. Hans Weber (hweber@molbio1.unizh.ch) ist Titularprofessor am Institut für Molekularbiologie der Universität Zürich.


unipressedienst uniz?rich-Magazin


uni pressedienst Pressestelle der Universität Zürich
Felix Mäder (fmaeder@zuv.unizh.ch)
http://www.unizh.ch/upd/magazin/1-96/gene.html
Last update: 1-APR-96