Gen (Aufbau)
Ein Gen ist ein definierter Abschnitt des DNA-Stranges, der ein Protein (Eiweiß) beschreibt. Die Gesamtheit aller Gene eines Lebewesens nennt man Genom. Ein Gen ist also eine Abfolge (Sequenz) von Basenpaaren mit genau definierter Länge. Dabei werden immer drei Basenpaare zusammengefasst, die als Triplette bezeichnet werden und die die ’Zeichen’ des genetischen Codes darstellen. Jedes Triplett codiert dabei genau für eine Aminosäure (Baustein eines Proteins).
Jedes Gen ist aus einer genau bestimmten Abfolge von Basentripletten bzw. Aminosäuren zusammengesetzt. Es beschreibt also ein Protein, das bei der Genexpression oder Proteinbiosynthese von der RNA (Ribonukleinsäure) entlang der DNA abgelesen und nach dieser „Vorschrift“ zusammengebaut wird (Ein-Gen-ein-Enzym-Hypothese). Damit das auch reibungslos klappt, besteht ein Gen zum einen aus dem Bereich, wo das Protein codiert ist und zum anderen aus verschiedenen Bereichen, die dieses Ablesen (Transkription) steuern.
Gene werden immer in einer bestimmten Richtung abgelesen, und zwar beginnend von der 3’-Seite hin zur 5’-Seite. Der eigentliche Bereich, in dem die Erbinformation codiert ist, wird als Offener Leserahmen (Open Reading Frame oder ORF) bezeichnet. Bei Eukaryoten-DNA beginnt er immer mit der Basenabfolge ATG (sogenanntes Startcodon) und codiert im Folgenden ein Protein bis zum Stoppcodon (TAG, TAA oder TGA, bei der RNA UAG, UAA oder UGA). Dieses codiert keine Aminosäure (wird daher auch als ’Nonsense-Codon’ bezeichnet) und führt somit zum Abbruch der Transkription.
Angrenzend an den ORF befinden sich nicht-codierende Bereiche, die sogenannten UTR-Bereiche (untranslated region). Auch hier gibt es den ’vorderen’ 5’-UTR (auch als Leader-Sequenz bezeichnet) und den ’hinteren’ 3’-UTR. Diese Bereiche werden bei der Transkription mit abgelesen, enthalten aber keine Codes für Aminosäuren, sondern Informationen zur späteren Übersetzung (Translation) des abgelesenen Codes, also quasi die ’Anmerkungen’.
Des weiteren ist der ORF bei eukaryotischer DNA unterteilt in Introns und Exons. Introns werden nicht codiert, d. h. sie werden mit abgelesen, aber ihre Sequenzen werden anschließend nicht in Aminosäuren übersetzt, sondern sie werden aus der mRNA (der sogenannten prä-mRNA) herausgeschnitten (gespleißt). Introns haben häufig am Anfang die Basensequenz GU und am Ende AG. In der Mitte befinden sich oft Stoppcodons, die bei einer Translation einen Abbruch zur Folge haben. Häufig entscheidet sich erst während des Spleißens (beim sogenannten alternativen Spleißen), welche Introns herausgeschnitten werden. Hier müssen die verbliebenen Introns durch Binden eines regulatorischen Proteins versteckt (maskiert) werden, damit es nicht zum Ablesestopp oder vorzeitigem Abbau kommt. Dadurch erhöht sich die Menge an Kombinationsmöglichkeiten, es können also aus einem Gen mehrere Proteine abgelesen werden, je nachdem, welche Bereiche herausgeschnitten werden.
Exons sind die Genabschnitte, die Aminosäuren codieren und nach dem Herausspleißen noch übrig sind (inklusive der UTR). Nach dem Herausschneiden wird die prä- mRNA zur ’reifen’ mRNA.