Im Jahr 2000 wurde mit der Genomsequenz der Modellpflanze Arabidopsis thaliana das erste vollständig bekannte Pflanzengenom veröffentlicht. Um das Jahr 2005 kamen neue Sequenziertechnologien auf, die Wissenschaftlern das Erstellen weiterer pflanzlicher Genomsequenzen erleichterten. Anfang Oktober 2010 waren 25 Genomsequenzen für 19 Pflanzenarten öffentlich verfügbar. Von den 19 verfügbaren Pflanzengenomen stammten 13 von Nutzpflanzen. 15 Projekte waren noch im Gange und die Daten noch nicht öffentlich zugänglich. Doch bis heute sind Reis und Arabidopsis die einzigen Pflanzenarten, von denen ein vollständig sequenziertes Genom existiert. Woran liegt das?
Zentraler Fokus fehlt
Bei der Sequenzierung von Tiergenomen liegt der Fokus auf der Hand: Letztendlich sollen das menschliche Genom und sein dazugehöriger Organismus verstanden werden. In der Pflanzenwelt existiert solch ein zentraler Fokus nicht. Es gibt nämlich ca. 25 verschiedene Pflanzenarten, die für die Welternährung von Bedeutung sind. Dazu gewinnen sieben Pflanzenarten im Bereich der Biokraftstoff- und Biomaterialproduktion zunehmend an Bedeutung. Mit der Sequenzierung pflanzlicher Genome verfolgen Wissenschaftler sehr unterschiedliche Ziele. Die Genomsequenz dient beispielsweise:
Die technischen und finanziellen Möglichkeiten und Ziele haben die Auswahl der Genome, die Sequenzierungsstrategien und den Grad der Vollendung der Sequenzierung stark beeinflusst.
Die ersten sequenzierten Pflanzengenome, die von Arabidopsis thaliana und Oryza sativa (Reis), wurden mit Methoden erstellt, die in den späten 90er Jahren dem aktuellen Stand der Technik entsprachen: Wissenschaftler zerstückelten ein Genom und klonierten dessen Fragmente in künstliche bakterielle Chromosomen (engl.: bacterial artificial chromosome, BAC). Mit der Sanger-Methode ermittelten sie den genetischen Code dieser Klone und erstellten dann über physikalische Karten die Gesamtsequenz des betreffenden Genoms. Durch direktes Sequenzieren ohne vorherige Klonierung in BACs gelang es den Wissenschaftlern Stück für Stück bestehende Lücken zu schließen und Fehler oder Unklarheiten in der Basenabfolge zu beseitigen. Diese Methode ist gründlich, liefert qualitativ hochwertige Sequenzen, benötigt aber viel Zeit. An der Sequenzierung des Arabidopsisgenoms arbeiteten international hunderte Menschen über mehrere Jahre mit einem geschätzten Kostenaufwand von etwa 70 Millionen US-Dollar.
Schnell aber problematisch für komplexe Genome
In den letzten 10 Jahren reduzierten sich die DNA-Sequenzierungskosten um das Zehntausendfache. Die Basenabfolge zahlreicher Genome kann heute in relativ kurzer Zeit mit überschaubaren Kosten mit dem sog. „Whole-genome-shotgun“-Verfahren (WGS, dt. „Schrotschussverfahren“) ermittelt werden. Bei diesem Verfahren wird die gesamte Genomsequenz mehrfach kopiert und in 300 bis 1.000 Basenpaar lange, zufällige Fragmente zerstückelt, die anschließend sequenziert werden. Dies geschieht heutzutage hauptsächlich mit den sog. Hochdurchsatz-Next-Generation-Sequenzierungsgeräten (engl.: NGS). Die einzelnen Genomabschnitte, die sog. Reads, werden mit bioinformatischen Methoden auf Überlappungen untersucht und automatisiert zu einer Konsensussequenz mit möglichst wenigen Lücken zusammengesetzt. Verglichen mit der BAC-Strategie spart das WGS-Verfahren viel Zeit, denn Wissenschaftler können auf zeitaufwendige Klonierungen verzichten und brauchen keine physikalischen Karten der Chromosomen zu erstellen.
Nachdem die WGS-Methode erfolgreich für verschiedene Tiergenome angewendet wurde, etablierte sie sich auch für die Untersuchung von Pflanzengenomen. Diese stellen jedoch für die Forscher aufgrund ihrer Größe und Komplexität eine besondere Herausforderung dar, die mit der WGS-Methode alleine nicht zu meistern ist.