Genomsequenzierung für Eilige

Neue Methode spart Zeit und Geld

05.11.2013 | von Redaktion Pflanzenforschung.de

Gerste (Hordeum vulgare L.) besitzt ein komplexes Genom. (Quelle: © Dieter Hopf  / pixelio.de)

Gerste (Hordeum vulgare L.) besitzt ein komplexes Genom. (Quelle: © Dieter Hopf / pixelio.de)

Genome zu sequenzieren ist längst kein Hexenwerk mehr. Bei komplexen Genomen ist das Sortieren der vielen kleinen Sequenzabschnitte aber immer noch eine zeitraubende, kostspielige und mit Fehlern behaftete Angelegenheit. Eine neue Methode schafft nun Abhilfe.

Seit ihrer Erfindung vor etwa 8 Jahren lesen Hochdurchsatz-Sequenziergeräte Genome in immer kürzerer Zeit zu immer geringeren Kosten. Sogenannte Next-Generation-Sequenziergeräte ermöglichen mittlerweile ein Schnellverfahren zur Genomsequenzierung, die sog. Whole-Genome-Shotgun-Methode, zu Deutsch Schrotschussverfahren. Bei dieser Methode wird die gesamte Genomsequenz über eine große Anzahl zufällig platzierter kleiner DNA-Abschnitte, sog. Reads, gelesen.

Viele kurze Sequenzabschnitte

#####Projektbox#####
Diese Forschung wurde im Rahmen des PLANT 2030 Projekts TRITEX cofinanziert. TRITEX arbeitet an der Erforschung von Triticeae-Genomen per Hochdurchsatz-Sequenzierung. Mehr zum Projekt

Diese Forschung wurde im Rahmen des PLANT 2030 Projekts TRITEX cofinanziert. TRITEX arbeitet an der Erforschung von Triticeae-Genomen per Hochdurchsatz-Sequenzierung.
Mehr zum Projekt

Dazu zerstückeln Wissenschaftler zunächst das gesamte zu sequenzierende Genom in zufällige kleine Fragmente von definierter Größe, die dann direkt mit einer Next-Generation-Sequenzierungs-Methode (NGS) sequenziert werden. Ein Genom kann jedoch nicht einfach am Stück gelesen werden. Aus technischen Gründen kann man bisher nur Genomstücke mit einer Länge von etwa 150 Nukleotiden sequenzieren, danach enthält die Sequenz zu viele Fehler oder bricht ab.

Die Fragmente werden mit Methoden aus der Bioinformatik auf Überlappungen untersucht und automatisiert zu einer Konsensus-Sequenz mit möglichst wenigen Lücken zusammengesetzt. Das ist vor allem dann schwierig, wenn ein Genom große Abschnitte sich wiederholender Sequenzen enthält, wie es bei den großen, komplexen Pflanzengenomen unserer Nutzpflanzen sehr oft der Fall ist.

Schwierige genetische Verankerung der Sequenzabschnitte

Die Whole-Genom-Shotgun-Sequenzierungsmethoden erlauben einen schnellen Einblick in die meisten Gene eines Organismus. Einen großen Haken haben diese allerdings: Die Ergebnisse sagen nichts über die Anordnung der Sequenzabschnitte auf einem Chromosom aus, also auch nicht wo im Genom sich die Gene befinden. „Aus einem Genom entstehen oft mehrere Hunderttausend Leseabschnitte, sog. Contigs. Um ein Genom zusammenzusetzen, muss man diese Abschnitte genetisch verankern“, erklärt Dr. Nils Stein vom Leibniz-Instituts für Pflanzengenetik und Kulturpflanzenforschung (IPK) in Gatersleben.

Voraussetzungen: Spaltende Population, möglichst homozygote Nachkommen

Gerste (Hordeum vulgare L.) besitzt ein komplexes Genom mit vielen sich wiederholenden Sequenzen von insgesamt 5,1 Gigabasenpaaren (Gb). Damit ist es größer als das menschliche Genom, das 3,2 Gb umfasst. Eine echte Herausforderung also, wenn es um seine Sequenzierung geht.

Nils Stein beschreibt den neuartigen Versuchsansatz: „Wir haben die genomische DNA von 90 Individuen einer durch Kreuzung von Elternlinien spaltenden Population herangezogen. Jede dieser 90 Pflanzen haben wir in einfacher Abdeckung mit der Whole-Genome-Shotgun-Methode sequenziert.“ Mit einfacher Abdeckung bezeichnen die Forscher, wie oft ein und dasselbe Genom sequenziert wurde. Eine größere Häufigkeit merzt Fehler aus, ist aber auch teurer. „Dann haben wir für jeden Sequenzabschnitt über SNP-Marker die passenden Stellen im Genom gesucht“, so Nils. Stein.

#####1#####
So kann das Ergebnis einer DNA-Sequenzierung aussehen. Je nach Stärke eines Floureszenzsignals liest das Sequenziergerät die Base Adenin, Cytosin, Thymin oder Guanin.

So kann das Ergebnis einer DNA-Sequenzierung aussehen. Je nach Stärke eines Floureszenzsignals liest das Sequenziergerät die Base Adenin, Cytosin, Thymin oder Guanin.

Bildquelle: © iStockphoto.com/ nicolas_

An jeder Stelle im Genom erhielten die Wissenschaftler Sequenzinformationen von einem Teil der 90 Individuen. „Bei einer homozygoten, reinerbigen Population der Nachkommen erwarten wir an jedem polymorphen Genort eine Allelfrequenz von 1:1 der elterlichen Allele in der Nachkommenschaft“, erklärt Nils Stein, wie echte SNPs von Sequenzfehlern unterschieden werden können.

Ein Sequenzierungsansatz liefert mehrere Millionen solcher Informationen, die Forschern hilft, wesentlich mehr Sequenzabschnitte als bisher im Genom zu verankern. „Wenn man das gesamte Genom einer kleinen spaltenden Population betrachtet und darin Unmengen von Single-Nukleotid-Polymorphismen findet, erhöht das die Qualität der genetischen Verankerung der zusammengesetzten Sequenzstücke, die durch eine Whole Genome hotgun Sequenzierungsmethode (WGS) entstanden sind, beträchtlich“, fasst Nils Stein zusammen.

Schneller und kostengünstiger

Die so entstandenen Sequenzdaten des Gerste-Genoms verglichen die Wissenschaftler mit Sequenzen, die das Internationale Konsortium zur Gerste-Sequenzierung ein Jahr zuvor veröffentlicht hatte. Die Sequenz-Daten der Forscher stimmten mit denen des Konsortiums überein. Im ihrem aktuellen Ansatz konnten Nils Stein und seine Kollegen jedoch dreimal mehr Sequenzabschnitten einen Ort im Genom zuweisen als in vorherigen Arbeiten. Die Gaterslebener Wissenschaftler arbeiteten außerdem viel schneller und kostengünstiger als bisher.

Genomische Ressourcen vor der Referenzsequenz

„Wir haben einen Weg aufgezeigt, wie wir mit erheblich weniger Mitteln und im Prinzip für nahezu jede Spezies sehr gute genomische Ressourcen schaffen können, die es einem erlauben, genom-basierte Forschungs- oder Züchtungsaspekte zu etablieren, bevor für diese Spezies eine Referenzsequenz zur Verfügung steht“, erklärt Nils Stein den Nutzen der neuen Methode.

Für die Sequenzierung des Gerstengenoms konnten die Wissenschaftler etliche genetische Marker liefern, mit denen sie sehr viel mehr Sequenzinformationen als bisher im Genom verankern konnten. Nils Stein fasst zusammen: „Der Ansatz ist universell anwendbar für jede Spezies, für die es noch keine genomischen Ressourcen gibt. Die Voraussetzung dafür ist, dass man eine spaltende Population generieren kann, deren Nachkommen idealerweise homozygot sind.“ So lassen sich auch unzählige Sequenzabschnitte in eine genetische Anordnung bringen – ganz ohne aufwendige Klonierungen.


Quelle:
Mascher, M. et al. (2013): Anchoring and ordering NGS contig assemblies by population sequencing (POPSEQ). In: The Plant Journal, 76(4):718-727, (online 10. Oktober 2013), doi: 10.1111/tpj.12319.

Zum Weiterlesen auf Pflanzenforschung.de:

Titelbild: Gerste (Hordeum vulgare L.) besitzt ein komplexes Genom. (Quelle: © Dieter Hopf  / pixelio.de)

PLANT 2030 vereint die vom Bundesministerium für Bildung und Forschung (BMBF) geförderten Forschungsaktivitäten im Bereich der angewandten Pflanzenforschung. Derzeit umfasst dies die nationale Förderinitiative „Pflanzenbiotechnologie für die Zukunft“ und die Ausschreibungen des transnationalen Programms „PLANT-KBBE“, an denen sowohl Wissenschaftler aus dem akademischen Bereich als auch privatwirtschaftliche Unternehmen beteiligt sind.
Weitere Informationen finden Sie unter: PLANT 2030