News

Erdbeobachtungsdaten für alle!

Wie ermöglicht man der ganzen Welt Zugriff auf wichtige wissenschaftliche Daten? Die TU Wien leitete das EU-Projekt openEO, in dem Schnittstellen für Cloud-Plattformen entwickelt wurden.

Der Sentinel-Satellit, im Hintergrund ein Ausschnitt des Erdballs.

© ESA/ATG medialab

Der Sentinel-Satellit

Die Erde steht unter ständiger Beobachtung – durch hunderte Satelliten. Ihr Zweck: Daten zu sammeln, etwa über den Klimawandel, über Meteorologie, über natürliche Ressourcen, die Gesundheit der Ozeane oder Naturkatastrophen. Die EU-eigene Flotte von Erdbeobachtungssatelliten (Earth Observation, EO), bekannt als Copernicus Sentinels, stellt täglich über 20.000 Gigabyte neue Daten zur Verfügung – für alle, die sich dafür interessieren. Und das alles ist kostenlos, dank Europas Open-Data-Politik.

Allerdings gibt es ein Problem. So unschätzbar wertvoll die Daten für Forschende auch sein mögen, die Gesamtmenge ist so enorm, dass es immer schwieriger wird, sinnvoll damit umzugehen. „Wir müssen Big-EO-Data im Petabyte-Maßstab speichern und verarbeiten“, sagt Univ. Prof. Wolfgang Wagner, Dekan der Fakultät für Mathematik und Geoinformation und Leiter des openEO-Projekts. „Eine Lösung ist die Speicherung und Verarbeitung der Daten direkt in der Cloud.“ Es gibt viele neue Angebote, für einen immer größer werdenden Kreis von Anwender_innen aus Wissenschaft, Industrie und Verwaltung. Das gelang sehr schnell – möglicherweise sogar zu schnell, wie sich nun herausstellt.

Allgemein anerkannte Standards

„Die Geschwindigkeit bei der Entwicklung neuer Cloud-Plattformen hat verhindert, dass ein weithin akzeptierter Standard entwickelt wird. Das führt zu technischen Herausforderungen für die User“, erklärt Dr. Matthias Schramm, Projektkoordinator am Department für Geodäsie und Geoinformation.

An dieser Stelle setzt das Projekt openEO an. Von 2017 bis 2020 entwickelten die Projektpartner neue Kommunikationsschnittstellen, die einen standardisierten Zugriff auf EO-Daten ermöglicht. Mithilfe von openEO Interfaces können vom eigenen Rechner einheitliche Kommandos an die Cloud-Anbieter gesendet werden, bei denen die Daten gespeichert sind. Dort werden sie dann automatisch in die Syntax übersetzt, die der jeweilige Cloud-Dienst versteht.

Vielseitige Werkzeugkiste

„Es gibt nun openEO-Schnittstellen für die Programmiersprachen Python, R und JavaScript. Außerdem haben wir ein QGIS-Plugin, einen Web-Editor und mobile Anwendungen erstellt, die mit den Cloud-Plattformen kommunizieren. Verschiedene europäische Plattformen sind bereits an die openEO-Schnittstelle angebunden, um eine standardisierte Kommunikation zu ermöglichen, und alle Aspekte der Open-Source-Schnittstelle sind so konzipiert, dass eine zukünftige Anbindung weiterer Plattformen und Programmiersprachen möglich ist“, erzählt Dr. Schramm.

Um sicherzustellen, dass die Datenverarbeitung verlässlich funktioniert und sich die Ergebnisse bei den verschiedenen Cloud-Anbietern nicht unterscheiden, entwickelte das Team fünf Use Cases und testete Workflows mit der openEO-Syntax auf mehreren Plattformen. Die Unterschiede in den Ergebnissen lagen bloß in der Größenordnung von Rechenungenauigkeiten, was dafür spricht, dass die Schnittstelle sehr gut funktioniert.

„Mehrere projektexterne Cloud-Plattform-Anbieter, aber auch EO-Anwender und die Klimaforschung haben bereits Interesse gezeigt, die openEO-Schnittstellen in ihre Dienste einzubetten“, so Dr. Schramm.