Schneller, länger, billiger

Die 3. Revolution der Sequenzierung

06.07.2018 | von Redaktion Pflanzenforschung.de

Next-Generation-Sequencing-Geräte haben den Nachteil, dass nur kurze DNA-Abschnitte („reads“) abgelesen werden können. (Bildquelle: © illarionova / Fotolia.com)

Next-Generation-Sequencing-Geräte haben den Nachteil, dass nur kurze DNA-Abschnitte („reads“) abgelesen werden können. (Bildquelle: © illarionova / Fotolia.com)

Vier Jahrzehnte nach Sanger hat sich die Sequenzierung von Genomen dramatisch verändert: Sehr viel schneller, kostengünstiger und genauer sind die Sequenzanalysen in den letzten Jahren geworden. Viele der Verbesserungen sind den längeren „Reads“ geschuldet. Im Moment gehen sie noch auf Kosten von Genauigkeit oder Zeit. Doch das wird sich sicher bald ändern.

Vor rund 40 Jahren revolutionierte die Sequenzierung nach Sanger die Molekularbiologie. Sie ermöglichte erstmals, den genetischen Code in seiner Abfolge zu lesen und damit Genomsequenzen zu bestimmen. Den Höhepunkt ihrer Anwendung fand die Methode im Humangenomprojekt – dem bisher weltweit größten biologischen Kollaborationsprojekt in der Biologie, das im Jahr 1990 ins Leben gerufen wurde. Die Sequenzierung des menschlichen Genoms dauerte 13 Jahre und kostete 3 Milliarden US-Dollar – Zahlen, die jeden Biologen heute erschaudern lassen.

NGS – die zweite Revolution

Als die humane Referenz-Genom-Sequenz ermittelt war, untersuchten Wissenschaftler die Sequenz-Variationen des menschlichen Genoms. Doch dafür war die Sanger-Methode zu umständlich. Sie nahm zu viel Zeit in Anspruch und war viel zu teuer. Kurz nach der Jahrtausendwende ermöglichten die „Next-Generation-Sequencing-Geräte“ (NGS) ein wesentlich schnelleres und kostengünstigeres Sequenzieren. Tausende bis Millionen Sequenzreaktionen waren mit diesen Geräten parallel möglich.

#####1#####
Der erste Ausdruck des menschlichen Genoms visualisiert als Buchserie, ausgestellt im 'Medicine Now' Raum (Wellcome Collection, London). Die Information der 3,4 Mrd Basenpaare der DNA wurde überführt in mehr als 100 Buchbände, jedes 1.000 Seiten, in kleinstmöglicher Schriftgröße.

Der erste Ausdruck des menschlichen Genoms visualisiert als Buchserie, ausgestellt im 'Medicine Now' Raum (Wellcome Collection, London). Die Information der 3,4 Mrd Basenpaare der DNA wurde überführt in mehr als 100 Buchbände, jedes 1.000 Seiten, in kleinstmöglicher Schriftgröße.

Bildquelle: © Samuel Mann/flickr/CC BY 2.0

Zeitraubende bakterielle Klonierungsschritte von DNA-Fragmenten und die elektrophoretische Auftrennung der Sequenzierungsprodukte waren überflüssig geworden. Mit der technischen Weiterentwicklung der NGS-Geräte fielen die Preise für Sequenzierungen so rapide, dass diese Untersuchungen auch für kleinere Labore und Projekte erschwinglich wurden. Im Jahr 2014 konnte das menschliche Genom schließlich für weniger als 1.000 US-Dollar sequenziert werden.

Problem: sich wiederholende Sequenzen

Die NGS-Geräte haben die Genomforschung zwar wesentlich vorangetrieben, aber sie sind nicht frei von Schwachstellen. Eine der größten Einschränkungen ist die kurze „Read“-Länge. Das bedeutet, dass in jeder einzelnen Sequenzierreaktion auf Grund technischer Beschränkungen nur kurze DNA-Abschnitte („reads“) bis maximal 1.000 Basenpaare abgelesen werden können. Nach Erhalt der Sequenz wird dann der nächste Abschnitt gelesen. Dieses Verfahren wird auch als „chromosome walking“ bezeichnet.

Diese bereitet dann Probleme, wenn die sich in Genomen häufig vorkommenden wiederholenden Sequenzen länger sind als die NGS-Reads. Die gelesenen Abschnitte können dann nicht so einfach einander zugeordnet werden, um daraus die Gesamtsequenz abzuleiten. So entstehen Fehler oder Lücken in der Genomsequenz. Das ist vor allem bei den komplexen pflanzlichen Genomen häufig der Fall, kommt aber auch im menschlichen Genom vor.

Schwierige Variationsanalysen mit kurzen Reads

Auch die Variationsanalyse gestaltet sich mit NGS-Geräten teilweise schwierig: Während kleine Variationen, die beispielsweise nur ein Nukleotid betreffen, problemlos erfasst werden können, sind größere, strukturelle Variationen mit kurzen Reads nicht so leicht zu detektieren - doch gerade diese Variationen mit mehr als 50 Basenpaaren sind z. B. in der Medizin mit zahlreichen Krankheitsbildern verknüpft und daher für Wissenschaftler besonders interessant. Doch damit nicht genug: NGS Methoden basieren auf der Polymerase-Kettenreaktion (PCR), die bei besonders GC-reichen Sequenzabschnitten nicht mehr verlässlich arbeitet.

Die 3. Revolution: Ohne PCR, mit längeren Reads

Kurz nach der Markteinführung von NGS-Geräten standen auch schon die „Third-Generation-Sequencing“-Maschinen (TGS) in den Startlöchern. Sie ermöglichen die Einzel-Molekül-Sequenzierung und die Sequenzerfassung in Echtzeit. Im Jahr 2011 eroberte das erste „Single-Molecule-Real-Time-Gerät“ (SMRT) von Pacific Biosciences der Markt. Im Jahr 2014 folgte das sogenannte Nanopore-Sequencing der Firma Oxford Nanopore Technologies.

Sowohl die Einzel-Molekül-Sequenzierung in Echtzeit als auch das Nanopore-Sequencing arbeiten ohne PCR- Amplifikation und erzeugen beträchtlich längere Reads als die NGS-Geräte. Diese Long-Read-Technologien revolutionieren erneut die Genomforschung, denn mit ihrer Hilfe können Wissenschaftler Genome in einer noch nie dagewesenen Auflösung erforschen.

Nanopore-Sequencing

Die Idee, Nanoporen in einer Membran zu verwenden, um einzelsträngige (ss) DNA- oder RNA-Moleküle zu sequenzieren, entstand zwar bereits Ende der 1980er Jahre. Aufgrund von technischen Hindernissen wurden mit dieser Technik erst im Jahr 2012 erste Sequenzierergebnisse veröffentlicht.

Im Gegensatz zur SMRT-Sequenzierung ist die Nanopore-Leselänge nicht durch die Technologie selbst begrenzt, sondern durch die Länge der zu sequenzierenden DNA-Moleküle. Bei guter DNA-Qualität können daher extrem lange Reads von bis zu einer Millionen Basen (1 Megabase oder  1 mB) erreicht werden – ein enormer Fortschritt gegenüber den NGS-Geräten (mit Reads von ca. 300 bp).

#####2#####
Für die Analyse pflanzlicher Genome eignen sich die neuen long-Read Technologien der 3. Generation besonders gut, da Pflanzengenome oft sehr komplex aufgebaut sind und zahlreiche sich wiederholende Sequenzen enthalten.

Für die Analyse pflanzlicher Genome eignen sich die neuen long-Read Technologien der 3. Generation besonders gut, da Pflanzengenome oft sehr komplex aufgebaut sind und zahlreiche sich wiederholende Sequenzen enthalten.

Bildquelle: © pixabay/CC0

Da Nanopore-Sequencing-Geräte einen Strang im Gegensatz zu Einzel-Molekül Echtzeit-Geräten (SMRT) nur einmal lesen können, arbeitet die Technologie mit einer Fehlerquote von etwa 15 % noch recht ungenau. Der Hersteller hat daher ein System entwickelt, das die Fehlerquote nach eigenen Angaben auf 3 % senkt. Das sogenannte ‘two-directional’ (2D)-Sequencing büßt allerdings etwas an Schnelligkeit ein, da unmittelbar nach dem ersten Strang ein zweiter die Membran passieren muss.

Long-Read-Sequenzierung bald Standard?

Methoden, die lange Reads erzeugen, haben die Genomforschung also ein drittes Mal revolutioniert. Unklare Genombereiche und Transkriptome können nun bis ins kleinste Detail erforscht werden. Auch Metagenomik-Analysen profitieren von langen Reads, mit der erstmals auch die Zusammensetzung von ganzen Mikrobengemeinschaften auf Artenebene untersucht werden kann.

Die Chancen stehen gut, dass sich die Long-Read-Sequenziermethoden in nicht allzu ferner Zukunft zu einem Standardwerkzeug in der medizinischen Diagnostik etablieren könnten. Eine kürzlich erschienene Einzel-Molekül-Echtzeit-Sequenzierungsstudie verdeutlichte, dass nur lange Reads eine Sequenz-Variation im Genom des Patienten aufdecken konnten, die mit anderen Methoden nicht detektierbar war.

Rasante Entwicklung mit ultralangen Reads

Insbesondere die Nanopore-Sequenzierung hat sich in den letzten Jahren rasch verbessert. So konnten Wissenschaftler das Genom von E. coli in einfacher Abdeckung mit nur sieben ultra-langen Reads ablesen. Ultralange Reads werden in naher Zukunft auch vollständige, lückenlose Genomsequenzen des Menschen ermöglichen – ein weiteres wertvolles Werkzeug für die genetische Forschung und für die personalisierte Medizin. Aber auch für die Pflanzenzüchtung wird diese Sequenziermethode viele Vorteile bringen. Denn die langen Reads ermöglichen auch hier, bisher unlesbare Sequenzabschnitte zu entziffern und Sequenzvariationen aufzudecken. Die portable Variante (MiniON) ermöglicht zudem das Sequenzieren außerhalb des Labors und könnte vor allem für Drittweltländer mit schlechter Infrastruktur interessant sein.

Die dritte Revolution in der Sequenziertechnik hat gerade erst begonnen – und es wird mit Sicherheit nicht die letzte sein. Die kommenden Jahre versprechen noch weitere neue Entwicklungen und spannende Entdeckungen.


Quelle:
Van Dijk, E. L. et al. (2018): The Third Revolution in Sequencing Technology. In: Trends in Genetics, (22. Juni 2018), doi: 10.1016/j.tig.2018.05.008.

Zum Weiterlesen auf Pflanzenforschung.de:

Titelbild: Next-Generation-Sequencing-Geräte haben den Nachteil, dass nur kurze DNA-Abschnitte („reads“) abgelesen werden können. (Bildquelle: © illarionova / Fotolia.com)