Exakte Ertragsprognosen durch KI

Die Digitalisierung hat auch in der Landwirtschaft zu enormen Datenmengen geführt. Diese sinnvoll zu nutzen, ist jedoch manchmal schwierig, weil sich die Zusammenhänge komplexer Merkmale wie Ertrag und Nährstoffgehalt darin manuell kaum finden lassen. Algorithmen hingegen schaffen das.

Die Hypothese, dass ein einzelnes Gen für ein bestimmtes phänotypisches Merkmal kodiert, ist längst überholt. Doch die Realität ist oftmals noch weit komplexer - beispielsweise, wenn es um den Ertrag von Nutzpflanzen geht. Viele einzelne Zusammenhänge zwischen Ertrag, genetischen Faktoren und Umweltfaktoren hat die Pflanzenforschung aufgedeckt, aber das Gesamtbild der Wechselwirkungen ist kaum zu durchdringen. Ein großer Schritt hin zur Modellierung dieser und anderer Zusammenhänge in der Landwirtschaft ist Forschenden jetzt mithilfe von maschinellem Lernen gelungen. Eine zentrale Rolle spielten dabei Satellitenaufnahmen.

#####1#####

Großangelegte Feldversuche in Australien und Satellitendaten bildeten die Datengrundlage für das Training der Algorithmen.

Bildquelle: © David Mark / Pixabay

National Variety Trials und Satellitendaten als Grundlage

Grundlage der Daten, mit denen die Algorithmen trainiert wurden, bilden die australischen National Variety Trials. Darin wurden Hunderttausende Populationen der zehn landwirtschaftlich wichtigsten Nutzpflanzen – darunter Weizen, Raps und Hafer – in mehr als 6.500 Experimenten über zehn Jahre maschinell nach standardisierten Protokollen phänotypisiert. Diese phänotypische Vielfalt von Hunderten von Millionen individueller Pflanzen kombinierten die Forschenden mit Wetterdaten, über 10.000 standardisierten Bodenanalysen, 50.000 Feldjahren an Stoppelfeldabbrennmustern, Menge und Zeitpunkt von über 350.000 Anwendungen von Pflanzenschutz- und Düngemitteln, 10.000 Feldjahren an Fruchtfolgen sowie Daten zum Standortmanagement und Satellitenaufnahmen.

Anhand dieser Daten lernten die Algorithmen, wichtige agronomische Merkmale wie Ertrag, Blühzeitpunkt und Proteingehalt der Körner vorherzusagen. Mittels informatischer Methoden gelang es zudem, die wichtigsten Treiber hinter diesen komplexen Merkmalen zu identifizieren. Indem das Forschungsteam die Modelle auch an Standorten und Jahren testete, die nicht Teil des Trainings waren, wurden die Modelle robuster. Zwar verringerte sich die Genauigkeit der Prognosen etwas, doch die relevanten Merkmale blieben in den meisten Modellen mit hoher Genauigkeit prognostizierbar. So lag das Bestimmtheitsmaß R² bei 0,5 oder höher. Für die Ertragsprognosen konnten sogar Werte von 0,8 und mehr erzielt werden. Je mehr Daten einbezogen wurden oder je später im Jahr die Ertragsprognose abgefragt wurde, desto verlässlicher waren die Prognosen.

Methode umgeht Limitierungen der Blackbox

Methoden der künstlichen Intelligenz haben sich in den vergangenen Jahren etabliert, um in großen Datenbeständen Muster zu erkennen und Prognosen zu ermöglichen. Häufig ist das Ergebnis jedoch eine Blackbox, die nicht die Zusammenhänge von Mustern und Prognosen preisgibt. Es lässt sich daher oftmals wenig daraus lernen. Diese Hürde haben die Fachleute in diesem Fall genommen, indem sie relevante Parameter einzeln aus den Modellen entfernt haben und dann beobachteten, wie dies die Prognosegenauigkeit der so trainierten Algorithmen veränderte.

Zum einen trainierten die Forschenden die Modelle mit allen bis auf den jeweils untersuchten Parameter oder nur mit dem Zielparameter. Bei beiden Ansätzen zeigte sich, dass für alle Modelle der größte Einflussfaktor die Genauigkeit die Satellitendaten waren. Das ist insofern bemerkenswert, als dass in der Studie frei verfügbare Aufnahmen mit einer Auflösung von 250 bis 1.000 Metern pro Bildpunkt genutzt wurden. Kommerziell verfügbar sind deutlich höher aufgelöste Bilder mit Bildpunktmaßen von weniger als 40 Zentimetern, die die Prognosegenauigkeit noch deutlich steigern dürften.

#####2#####

Auch Hafer zählt zu den Nutzpflanzen, die im Rahmen des australischen National Variety Trials phänotypisiert wurden.

Bildquelle: © Manfred Richter / Pixabay

Allgemeingültige Faktoren für Ertragsprognose identifiziert

Über alle Modelle und Pflanzenarten hinweg deuten die Untersuchungen auf vier allgemeingültige starke Einflussfaktoren auf den Ertrag hin: die kumulierte Niederschlagsmenge, die latente Wärmeströmung sowie die Anwendungsrate von Schwefel und der Einsatz des Herbizids Clethodim. Die Wärmeströmung ist dabei ein Indikator für Wasserverfügbarkeit, Stomata-Leitfähigkeit und Transpirationsrate des Blätterdachs.

Die Autoren der im Fachjournal „Nature Plants“ erschienenen Studie gehen davon aus, dass hochaufgelöste Satellitenbilder daher eine substanzielle Rolle für künftige Modelle der Pflanzenzüchtung und großflächige Versuchsanbauten spielen werden. Um diese großen Datenmengen mit der „Datenflut“ wie aus der omics-Forschung zusammenzubringen, seien Modelle des maschinellen Lernens in Verbindung mit sorgfältiger Interpretation ein Mittel. Allerdings müssten die KI-Modelle noch weiter entwickelt werden, da die Schwankungen des Bestimmtheitsmaßes zwischen den Modellen auf fundamentale Begrenzungen bei der Extrapolation komplexer Systeme hindeuten.

Klimakrise gefährdet Prognosefähigkeit

Abschließend warnen die Forschenden vor den Effekten der Klimakrise auf Prognosemodelle. Wenn sich beispielsweise ursprünglich eher konstante Parameter wie die regionalen Niederschlagsmuster verändern, passen die Grundlagen nicht mehr, auf denen die Algorithmen trainiert wurden. Nicht zuletzt würden die Modelle dann Züchtungsziele empfehlen, die vielleicht schon nicht mehr gelten, wenn eine neue Sorte nach rund zehn Jahren Entwicklung auf den Markt kommt.

Quelle:
Newman, S. und Furbank, R. (2021): Explainable machine learning models of major crop traits from satellite-monitored continent-wide field trial data. In: Nature Plants, Vol. 7, 1354-1363, (4. Oktober 2021), doi: 10.1038/s41477-021-01001-0.

Zum Weiterlesen auf Pflanzenforschung.de:

Exakte Ertragsprognosen durch KI

Maschinelles Lernen kann sogar neue Züchtungsziele identifizieren