Es bleibt noch viel zu tun

Rückblick auf 20 Jahre Genomsequenzierung bei Pflanzen

22.12.2021 | von Redaktion Pflanzenforschung.de

Bei der DNA-Sequenzierung wird die Basenabfolge des Genoms bestimmt. Dabei kommen vier Basen vor: Adenin (A), Cytosin (C), Guanin (G) und Thymin (T). (Bildquelle: © iStock.com / isak55)

Bei der DNA-Sequenzierung wird die Basenabfolge des Genoms bestimmt. Dabei kommen vier Basen vor: Adenin (A), Cytosin (C), Guanin (G) und Thymin (T). (Bildquelle: © iStock.com / isak55)

In den letzten zwei Jahrzehnten haben Forschungsgruppen weltweit das Genom hunderter Pflanzenarten entschlüsselt. Eine Studie hat nun zusammengefasst, um welche Arten es sich handelt, aus welchen Ländern die Forschenden stammten und vor allem wo noch Nachholbedarf besteht, um Landpflanzen und deren Evolution besser verstehen zu können. Die Autoren regen auch an, ärmeren Ländern mehr Teilhabe zu ermöglichen.

Die erste Pflanze, deren Erbgut vollständig entschlüsselt wurde, war der beliebteste Modellorganismus in der Pflanzenforschung: die Ackerschmalwand (Arabidopsis thaliana). Im Jahr 2000 wurde ihr Genom im Fachmagazin „Nature“ veröffentlicht.

Bei der DNA-Sequenzierung wird die Basenabfolge des Genoms bestimmt. Da dies aufgrund der Größe der genomischen DNA nicht am Stück erfolgen kann, wird bei der Sequenzierung die DNA zunächst in kleine Stücke („Reads“) zerteilt. Die Sequenzinformationen der einzelnen Reads werden anschließend mit bioinformatischen Methoden geordnet und zur Gesamtsequenz zusammengeführt. Dieser finale Schritt nennt sich Assemblierung. Früher war es nahezu unmöglich, die Gesamtgenomsequenz von Pflanzen mit komplexe Genomen und höheren Ploidiegraden zu assemblieren. Doch der technologische Fortschritt hat dieses Problem mittlerweile bei praktisch jeder Spezies überwunden.

#####1#####
Sie war die erste Pflanze: Das Genom der unscheinbaren Ackerschmalwand (Arabidopsis thaliana) wurde im Jahr 2000 im Fachmagazin Nature veröffentlicht.

Sie war die erste Pflanze: Das Genom der unscheinbaren Ackerschmalwand (Arabidopsis thaliana) wurde im Jahr 2000 im Fachmagazin Nature veröffentlicht.

Bildquelle: © GABI

Mehr, schneller und besser

Laut Studie wurden bis heute fast 800 Landpflanzenspezies vollständig sequenziert und in öffentlichen Datenbanken veröffentlicht. Nicht nur die Anzahl, sondern auch die Genauigkeit der erfassten Sequenzdaten hat sich rasant verbessert. Das liegt darin begründet, dass Sequenzieren günstiger und schneller geworden ist, die technische Infrastruktur der Forschungseinrichtungen sich enorm gesteigert hat und die wissenschaftliche Gemeinschaft zunehmend vernetzt arbeitet.

Die neueste Gerätegeneration ist mittlerweile auch in der Lage, deutlich längere Reads an einem Stück abzulesen. Diese Long-Read-Technologien haben die Assemblierungsqualität erheblich verbessert. Die große Zahl an öffentlich zugänglichen Genomressourcen ist der Schlüssel zu einem verbesserten Verständnis der Genetik von Pflanzen und deren Evolutionsgeschichte.

Noch große taxonomische Lücken

Der Anteil der sequenzierten Pflanzenarten bezogen auf die Gesamtzahl der bekannten rund 350.000 Landpflanzenspezies ist allerdings noch sehr bescheiden: nur ca. 0,16 Prozent. Zudem liegen für bedeutende Kulturpflanzen wie Mais oder Reis gleich mehrere hochwertige Genom-Assemblies vor, die auch Tausende von Sorten, Landrassen und Ökotypen dieser Arten umfassen. Andere Pflanzenarten hat man bisher gänzlich „links liegen gelassen“.

Die meisten Sequenzdaten kommen aus der Familie der Kreuzblütler (Brassicaceae). Viele landwirtschaftlich wichtige Nutzpflanzen wie Raps oder Kohl gehören dieser an – sowie die Modellpflanze Arabidopsis thaliana. Ganze 83 Kreuzblütler, gefolgt von 80 Süßgrasartigen (Poales) und 67 Lippenblütlerartigen (Lamiales) fanden die Forschenden unter den sequenzierten Genomen. Wenn man den Artenreichtum der Landpflanzenordnungen vergleicht, sind sechs Ordnungen in den Genom-Assembly-Datenbanken statistisch überrepräsentiert. Es sind diese wirtschaftlich bedeutenden Kladen: Kreuzblütlerartige (Brassicales), Kürbisartige (Cucurbitales), Buchenartige (Fagales), Malvenartige (Malvales), Rosenartige (Rosales) und Nachtschattenartige (Solanales).

#####2#####
Bisher wurden überdurchschnittlich viele Kreuzblütler sequenziert. Raps ist ein bekannter Vertreter dieser Pflanzenfamilie.

Bisher wurden überdurchschnittlich viele Kreuzblütler sequenziert. Raps ist ein bekannter Vertreter dieser Pflanzenfamilie.

Bildquelle: © Jochen Schaft / Pixabay

Vier Ordnungen waren hingegen deutlich unterrepräsentiert: Spargelartige (Asparagales), Asternartige (Asterales), Enzianartige (Gentianales) und Tüpfelfarnartige (Polypodiales). Es überrascht nicht, dass es sich bei letzteren um artenreiche Ordnungen mit bemerkenswerter ökologischer, aber vergleichsweise geringerer ökonomischer Bedeutung handelt, schreiben die Autoren.

Wirtschaftlich bedeutende Arten bevorzugt?

Um herauszufinden, ob wirtschaftlich bedeutende Arten wirklich bevorzugt wurden, teilte das Team die Genome in sechs Kategorien von „domestiziert“ bis zu „wilden Verwandten“ ein. Sie identifizierten 394 Arten, die stark vom Menschen ackerbaulich genutzt werden. Die verbleibenden 404 Genom-Assemblies stammen von Wildarten, wovon 77 wilde Verwandte von Nutzpflanzen waren. Zwar sieht es im ersten Moment so aus, als wäre dieses Verhältnis in etwa ausgeglichen. Allerdings muss man jedoch im Hinterkopf behalten, dass es weit mehr Wildarten als domestizierte Arten auf der Erde gibt. Vor diesem Hintergrund ist eine deutliche Tendenz hin zu mehr ökonomisch bedeutenden Arten herauslesbar.

Appell für mehr Vielfalt

Zu Beginn des Zeitalters der Genomsequenzierung wurden vor allem Modell- oder Kulturpflanzenarten mit kleinen und diploiden Genomen sequenziert. Trotz verbesserter Technik  sind diploide Pflanzen noch immer überrepräsentiert. Ebenso landwirtschaftlich und wirtschaftlich bedeutende Arten. Die Beteiligten möchten aufgrund ihrer Analyse zu mehr taxonomischer Vielfalt bei der Auswahl der zu sequenzierenden Pflanzen ermutigen. Zumal Wildpflanzen und deren genetische Vielfalt einen wahren Schatz für die Pflanzenforschung und -züchtung darstellen.

Globales Ungleichgewicht

Doch noch ein anderes Ungleichgewicht wurde bei der Analyse deutlich. Die Forschenden glichen ab, aus welchen Ländern die Institutionen kamen, die die Assemblies in den Datenbanken einreichten. Sie stellen zwar nicht das gesamte Team dar, zeigen jedoch, wer federführend war.

#####3#####
Landwirtschaftlich und wirtschaftlich bedeutende Arten sind überrepräsentiert.

Landwirtschaftlich und wirtschaftlich bedeutende Arten sind überrepräsentiert.

Bildquelle: © aedkafl - Fotolia.com

Sie stellten fest, dass die Genomsequenzierung vor allem von China (235), den USA (212) und europäischen Ländern (168), darunter Deutschland und Großbritannien, dominiert wird. Rund 77 Prozent aller Genom-Assemblies stammt aus einer dieser drei Regionen. Weitaus weniger Genomforschung wurde von Teams aus Ozeanien (40), Südamerika (9) oder Afrika (1) geleitet.

Es gab auch deutliche Abweichungen zwischen dem Verbreitungsgebiet der Pflanzenarten und der nationalen Zugehörigkeit der Forschenden, die sie untersuchen. Das trifft vor allem für in Afrika und Südamerika beheimatete Nutzpflanzen zu. Die Analyse ist deutlich: 56 Prozent aller domestizierten Nutzpflanzen wurden außerhalb ihres Ursprungskontinents sequenziert und nur bei 13 Prozent waren Forschende aus dem entsprechenden Kontinent involviert.

Das Studienteam sieht hier noch ein Erbe der Kolonialzeit, als Forschende in andere Länder gingen, mit neuen Erkenntnissen nach Hause zurückkehrten und dort gefeiert wurden. Zwar sei diese Zeit vorbei, aber wohlhabende Länder im globalen Norden sowie China haben dieser Analyse zufolge noch immer eine Vormachtstellung. Zwar gäbe es gute Initiativen wie das Orphan Crop Genome Consortium. Das Team ruft aber zu noch mehr internationalen Kooperationen auf, vor allem unter Einbeziehung der Länder, in denen die jeweiligen Pflanzen heimisch sind. Der globale Süden müsse von dem neu erworbenen Wissen stärker profitieren und partizipieren, betonen die Studienbeteiligten.


Quelle:
Marks, R.A. et al. (2021): Representation and participation across 20 years of plant genome sequencing. In: Nature Plants, (29. November 2021), doi: 10.1038/s41477-021-01031-8.

Zum Weiterlesen:

Titelbild: Bei der DNA-Sequenzierung wird die Basenabfolge des Genoms bestimmt. Dabei kommen vier Basen vor: Adenin (A), Cytosin (C), Guanin (G) und Thymin (T). (Bildquelle: © iStock.com / isak55)