conference logo

Playlist "FOSSGIS 2018"

OpenMetaData

Sebastian Goerke

Der freie und unbeschränkte Zugang zu Daten ist das zentrale Element des Open Data Gedankens. Dieses Ziel ist durch alleinige Bereitstellung von Daten nicht zu erreichen, denn die bereitgestellten Daten müssen für Interessierte Nutzer auch auffindbar sein. Gerade im Kontext des Bundesministeriums für Verkehr und Digitale Infrastruktur ist dies eine zentrale Anforderung in Bezug auf die riesigen Datenschätze des Geschäftsbereiches. Im Rahmen des Modernitätsfonds mFUND untersuchen wir im Projekt "OpenMetaData" die Machbarkeit von Maßnahmen zur Verbesserung

Der freie und unbeschränkte Zugang zu Daten ist das zentrale Element des Open Data Gedankens. Dieses Ziel ist durch alleinige Bereitstellung von Daten nicht zu erreichen, denn die bereitgestellten Daten müssen für Interessierte Nutzer auch auffindbar sein. Gerade im Kontext des Bundesministeriums für Verkehr und Digitale Infrastruktur ist dies eine zentrale Anforderung in Bezug auf die riesigen Datenschätze des Geschäftsbereiches. Im Rahmen des Modernitätsfonds mFUND untersuchen wir im Projekt "OpenMetaData" die Machbarkeit von Maßnahmen zur Verbesserung der Auffindbarkeit von Daten. Im Fokus steht dabei die Erarbeitung von auf Open Source-Software basierenden Lösungsansätzen der Metadatenautomatisierung, die durch Deep Learning Verfahren angereichert zur Verbesserung der Datenauffindbarkeit auch hinsichtlich unterschiedlicher Suchkontexte führen sollen. Für diese Maßnahmen sehen wir insgesamt ein sehr großes Einsparpotential hinsichtlich der bisher für Metadatenerstellung und –pflege notwendigen personellen, finanziellen und zeitlichen Aufwände. Ebenfalls erwarten wir uns von den erarbeiteten Lösungsansätzen, dass sie geeignet sind die Hürden für die Datenbereitstellung auf der Anbieterseite dadurch zu senken und daraus resultierend die öffentlich zur Verfügung stehende Datenbasis quantitativ wie auch qualitativ aufzuwerten. Insbesondere der Einsatz von Deep-Learning Verfahren, welche bislang in den Bereichen Geo-IT und Open Data keine große Bedeutung besitzt, verfügt über das Potential auf disruptive Art und Weise dazu beitragen zu können, bisherige Verfahren der Metadatenbereitstellung auf den Kopf zu stellen und neue Möglichkeiten der Datenrecherche zu ermöglichen. In diesem Beitrag möchten wir darstellen, wie durch den Einsatz verschiedener Werkzeuge im OSGeo-Kontext in Kombination mit Ansätzen aus dem Deep-Learning der Automatisierungsgrad bei der Metadatenerzeugung und -pflege maximiert und die entsprechenden Aufwände auf ein Minimum reduziert werden könnten.