conference logo

Playlist "FOSSGIS 2014"

GeoKettle – FME für Geizige?

Jens Schaefermeyer

GeoKettle
GeoKettle ist ein ETL-Programm für räumliche Daten. ETL steht für Extract, Load und Transform. GeoKettle basiert auf der OpenSource Software Pentaho Data Integration (Kettle) und ist mit der LPGL lizensiert. GeoKettle unterstützt dabei u.a. die OpenSource Bibliotheken GeoTools, Degree und gdal/oge und sextante.
Ausgangslage
Bei der Werraenergie, einem Energiedienstleister in Thüringen, stand aufgrund eines Systemwechsels im Bereich des CAD auch ein Umzug der Geodaten von einer Oracle-Datenbank in eine PostgreSQL Datenbank mit PostGIS an. Die Daten der Werraenergie lagen in einem nicht dokumentierten Datenmodell vor und konnten nur mit einem CAD als Shapedateien exportiert werden. Nach dem Export lagen 247 verschiedene Shapefiles vor. Das Versorgungsgebiet der Werraenergie ist allerdings so groß, dass der Export nur in 40 sich zum Teil überlagernden räumlichen Einheiten durchgeführt werden konnte, was in insgesamt 11.000 Shapefiles resultierte. Die Inhalte der Shapedateien ware zudem nicht eindeutig, sodass in einem Shapefile für Leitungen, sowohl die Leitungen mit Ihren Attributen als auch Hilfslinien für die Beschriftungen mit den gleichen Attributen beinhalten konnten.

GeoKettle in action
Beim Import der Daten in die PostgreSQL-Datenbank mussten folgende Arbeiten vorgenommen werden:
Import der 11.000 Shapefile mussten in zwei verschiedene Datenbanken (Gas und Grundkarte)
Verteilen von Objekten in einem Shapefile auf mehrere Tabellen
Zusammenfassen von Objekte aus mehreren Shapefiles mit unterschiedlichen Attributfeldern in einer Tabelle
Veränderung von Attributen
Entfernen von redundanten Daten

Fazit
Ohne den Einsatz von GeoKettle wäre die Datenmigration bei der Werraenergie kaum zu stemmen gewesen. Dabei hat sich GeoKettle als gut dokumentierte und leicht zu erlernende Software heraus gestellt, die eine echte Alternative zur FME darstellt.