DNA-Sequenzierungsmethoden

Motoren der Genomforschung

15.04.2010 | von Redaktion Pflanzenforschung.de

DNA-Sequenzierung (Quelle: © iStockphoto.com/Nicolas Loran)

DNA-Sequenzierung (Quelle: © iStockphoto.com/Nicolas Loran)

Von der ersten DNA-Sequenzierung bis zur vollständigen Aufklärung des menschlichen Genoms vergingen 26 Jahre. Durch technische Neuerungen hat die DNA-Sequenzierung längst Einzug in zahlreiche Labore erhalten und damit auch die Pflanzenforschung revolutioniert. Gründe genug, um etwas mehr hinter die Kulissen der neusten Entwicklungen zu schauen.

Die Geburtsstunde der Genomforschung

1977, etwa 25 Jahre nach der Entschlüsselung der Struktur der DNA, brachten zwei parallel entwickelte Technologien die Genomforschung ins Rollen. Beide Technologien ermöglichten die Aufklärung der Abfolge der DNA-Bausteine.

Fred Sanger entwickelte eine Methode, durch die neue DNA enzymatisch erzeugt und anschließend analysiert wird. Die Sequenzierung nach Maxam und Gilbert dagegen erfolgt durch chemischen Abbaus der DNA. Sanger und Gilbert erhielten für die Entwicklung ihrer jeweiligen Sequenziermethoden 1980 den Nobelpreis für Chemie. Die Sequenziermethode nach Sanger setzte sich vor allem aufgrund ihrer guten Automatisierbarkeit, der Qualität der Sequenzen und der längeren Leseweiten durch.

Sequenziermethoden der nächsten Generation („Next generation sequencing“), wie beispielsweise die 1996 entwickelte Pyrosequenzierung, sind aus der Genomforschung heute nicht mehr wegzudenken und bieten die Möglichkeit der kostengünstigen und schnellen Ultra-Hochdurchsatz-Sequenzierung.

Das bisher ehrgeizigste Projekt der Biowissenschaften

#####bildbox1#####
Moderne Biowissenschaften nehmen die Doppelhelix-DNA und die Funktion der Gene

Moderne Biowissenschaften nehmen die Doppelhelix-DNA und die Funktion der Gene "unter die Lupe".

Bildquelle: © iStockphoto.com/Mark Evans

Mitte der achtziger Jahre schien die Zeit gekommen für ein Projekt, dessen Ausmaß alles in den Schatten stellen sollte, was es bis dahin auf dem Gebiet der Biowissenschaften gegeben hatte: Das Humangenomprojekt. 1988 beschlossen Wissenschaftler, die gesamte genetische Information des Menschen zu kartieren, um schließlich alle Gene auf dem etwa 3,2 Milliarden Basenpaare langen DNA-Faden der 23 Chromosomen identifizieren zu können.

Das Humangenomprojekt startete im Jahr 1990 mit dem Ziel, das gesamte menschliche Genom bis zum Jahr 2005 zu sequenzieren. Auf dem Weg zum vollständig bekannten menschlichen Genom entschlüsselten Wissenschaftler im Jahr 1995 erstmals das gesamte Genom eines Bakteriums (Haemophilus influenza) und im darauf folgenden Jahr das der Bäckerhefe Saccharomyces cerevisiae. 1998 war auch die DNA-Sequenz des ersten mehrzelligen Organismus, des Fadenwurms Caenorhabditis elegans, bekannt. 

Nur doppelt so viele Gene wie eine Fliege!

Das Humangenomprojekt wurde im gleichen Jahr maßgeblich durch die Erfindung der Pyrosequenzierung beschleunigt. Mit diesem Hochdurchsatzverfahren ließ sich DNA viel schneller und kostengünstiger sequenzieren als mit der traditionellen Sanger-Methode.

Bereits im Jahr 2000 gaben die amerikanischen Wissenschaftler Craig Venter und Francis Collins die Entschlüsselung des menschlichen Genoms bekannt. Die Zusammensetzung der entschlüsselten Sequenz auf Karten des menschlichen Genoms erfolgte ein Jahr später. Dabei stellte sich heraus, dass der Mensch etwa 20.000 bis 25.000 Gene besitzt - nur doppelt so viele wie z.B. eine Fliege! Wissenschaftler hatten mit wesentlich mehr Genen im menschlichen Erbgut gerechnet. Das Humangenomprojekt wurde im Jahr 2003 offiziell beendet und das menschliche Genom für vollständig sequenziert erklärt.

Als die DNA-Sequenz des menschlichen Genoms im Jahr 2001 bekannt gegeben wurde, war die zugrunde liegende Sequenz nicht die einer einzelnen Person, sondern eine Kombination verschiedener Menschen. Im Jahr 2007 erfolgte dann die erste Sequenzierung eines Individuums, passenderweise wurde dafür der Entdecker der DNA-Struktur James Watson ausgewählt. Später ließ auch der Genetiker Craig Venter seine DNA entschlüsseln.

Heute sind über tausend Genome verschiedener Tiere, Pflanzen, Bakterien, Viren etc. teilweise oder ganz in ihrer DNA-Sequenz bekannt. Das „National Center of Biotechnology Information“ (NCBI) veröffentlicht auf seiner regelmäßig aktualisierten Webseite sämtliche öffentlich zugängliche DNA-Sequenzen.

Zeitraubend, arbeitsaufwändig und teuer

Die Sequenzierung des ersten menschlichen Genoms arbeiteten über 1000 Wissenschaftler. Sie dauerte 13 Jahre und kostete ungefähr 3 Milliarden Dollar – also circa einen Dollar pro Basenpaar. Unter diesen Bedingungen war die neue Technik keinesfalls für biomedizinische oder biologische Forschungszwecke einsetzbar. In den folgenden Jahren wurden die Analysemethoden mit Hochdruck verbessert, sodass Genomsequenzierungen heute in einem zumutbaren Zeitrahmen zu wesentlich geringeren Kosten durchführbar sind.

DNA-Sequenzierung der nächsten Generation

Seit ungefähr fünf Jahren sind neue DNA-Sequenziertechniken auf dem Markt, die als Techniken der „Neuen Generation“ (engl.: „Next-Generation-Sequencing“, NGS) bezeichnet werden. Die meisten Ultra-Hochdurchsatz-Methoden verwenden nicht mehr eine Auftrennung der DNA über Kapillarelektrophorese wie bei der Sanger-Methode, sondern eine Kopplung von Molekülen an Oberflächen und Aufnahmen von Reihen von hochauflösenden Bildern. Diese innovativen Technologien haben das Potential, die biologische und biomedizinische Forschung zu revolutionieren, indem sie Genom-Ananlysen wesentlich beschleunigen und vergünstigen.

Während die Sequenzierung einer Megabase nach dem Sangerprinzip ungefähr 500 US-Dollar kostet, sind diese Daten mit den neuen Geräten bereits wesentlich schneller und günstiger zu haben (siehe Tabelle). Mit den NGS-Technologien kann derzeit in 8 Wochen für 100.000 Dollar ein gesamtes menschliches Genom sequenziert werden.

#####bildbox2#####
Sequenziergerät Genome Sequencer FLX.

Sequenziergerät Genome Sequencer FLX.

Bildquelle: © Roche

Viele Daten, aber wohin damit?

Die neuartigen DNA-Sequenziergeräte unterscheiden sich von der traditionellen Sanger-Sequenziermethode aber vor allem auch durch die deutlich höheren Datenmengen, die von ihnen erzeugt werden. Sämtliche Sequenzier-Methoden liefern zunächst nur Rohdaten, die ohne den Einsatz bioinformatischer Hilfsmittel in der Auswertung praktisch wertlos sind. Die umfangreiche Datenmenge und die kürzeren Leselängen erfordern wiederum eine zielgerichtete Bioinformatik und leistungsfähige Computer, um den Wissenschaftlern die biologische Relevanz ihrer Daten offen zu legen.

Die produzierte Datenmenge der neuen Sequenziergeräte ist oft so groß, dass sie von einem durchschnittlich ausgestatteten Laborrechner kaum bewältigt werden kann.  Ein Typus, der 454 Sequenzierer von 454 – Roche, produziert z.B. pro Durchlauf etwa 12 bis 15 Gigabytes. Ein zweistündiger Durchlauf eines eines Illumina Genome Analyzers resultiert sogar in 10 Terrabytes!  Da kommen viele Computersysteme nicht mehr mit. Die Datenanalyse muss in speziell dafür ausgerüsteten Rechenzentren verwaltet und bearbeitet werden, was oft zeitaufwändig und teuer ist.

Grenzen der neuen Super-Sequenziermaschinen

Aufgrund technischer Beschränkungen kann ein Genom auch mit den neuartigen Sequenziermaschinen nicht in einem einzelnen Ansatz von Anfang bis Ende in einer linearen Reaktion abgelesen werden. Es muss während der Sequenzierung in kleinere Stücke untergliedert werden. Die Leselängen sämtlicher bisher kommerziell erhältlicher Next-Generation-Sequenziergeräte sind jedoch erheblich kürzer als die der Sanger-Sequenziermethode. Sie müssen nach der Sequenzierung mit bioinformatischen Hilfsmitteln aufwändig zu einem vollständigen Genom zusammengefügt werden. Außerdem kam es bei schwierig zu lesenden Stellen (z.B. bei hochrepetiviven Sequenzen) des Genoms häufig zu Leseungenauigkeiten.

Was wird die Zukunft bringen?

Schwachstellen einzelner Sequenziergeräte werden heute je nach Anwendung durch eine Kombination verschiedener Next-Generation-Geräte und Sequenzier-Methoden kompensiert. Die Hersteller der neuen Geräte arbeiten bereits mit Hochdruck an der Lösung dieser Probleme: Die amerikanische Firma Pacific Biosciences Corporation kündigte Ende letzten Jahres in einer Veröffentlichung im Science-Magazin eine weitere Revolution in der Genomsequenzierung an (Eid J, Fehr A, Gray J, Luong K, Lyle J, et al. (2009) Real-Time DNA Sequencing from Single Polymerase Molecules. Science 323: 133–138.).

Darin beschreiben Wissenschaftler das sog. Real-Time-Sequencing, bei dem die DNA-Polymerase direkt beim Einbau der Nukleotide des wachsenden DNA-Stranges beobachtet wird. Diese neuartige Technologie verspricht Leselängen ähnlich der Sanger-Methode, allerdings in erheblich kürzerer Zeit und zu wesentlich geringeren Kosten. Dies könnte ein weiterer, wichtiger Meilenstein auf dem Weg zum „1000-Dollar-Genom“ und zur personalisierten Medizin sein.


Zum Weiterlesen: