osm_address_db - Adressdaten in der OSM-Datenbank
Bereits auf der vergangenen FOSSGIS in Münster wurde das Projekt osm_address_db in
einem Lighting-Talk vorgestellt. Entstanden ist die Idee für dieses Projekt im Jahr 2013
als mich jemand ansprach und wissen wollte, ob Adressdaten (Land, PLZ, Ort, Straße,
Hausnummer, Position) aus der OSM-Datenbank für externe Projekte extrahiert werden können.
Daraus entstanden ist eine Sammlung von Shell- und SQL-Skripten, die mithilfe des Tools
osm2pgsql und einer PostgreSQL/Postgis-Datenbank eine Tabellenstruktur aufbaut, die für
den Export und weiter Auswertungen der Adressdaten in OSM verwendet werden kann.
Im Vortrag wird neben der Datenstruktur, benutzten Tools und Technologien sowie die
während der Entwicklung aufgetretenen Schwierigkeiten u.a. mit den verschiedenen
Import-Tools von OSM dargelegt. Die OSM-Daten werden nach dem Karlsruher Schema
analysiert, dabei werden auch associatedStreet-Relationen für den Aufbau der Tabellen
berücksichtigt. Nach dem Import der relevanten Tags werden dann alle fehlenden Daten aus
den Grenz-, Postleitzahlen- und associatedStreet-Relationen gefüllt, sodass eine
vollständige Tabelle mit Adressen entsteht, die als CSV-Datei exportiert und dann in einem
beliebigen Programm importiert werden kann. Bei der Entwicklung der Datenstruktur wurde
darauf geachtet, dass eine Aktualisierung der Datenbank mit diff-Dateien möglich ist.
Um eine mögliche Verwendung und die Kontrolle der importierten Daten zu ermöglichen, wurde
zunächst ein Prototyp entwickelt, der die Auswahl eines Ortes über die Hierarchieebenen
(admin_level) ermöglicht und dann alle Informationen zu einem Ort bzw. Stadt liefern. Dazu
zählen neben den Adressen auch die Postleitzahlen, Straßen und untergeordnete
Hierarchieebenen (Orts- und Stadtteile). Der Prototyp ermöglicht, auf Basis der
analysierten Daten, ebenfalls fehlerhafte Schreibweisen von Orts- und Straßennamen in den
Tags der Adressen heraus zu finden.
Derzeit befindet sich eine Webanwendung in Entwicklung, die eine Umsetzung des Prototypen
vorsieht. Dabei sind schon viele Ideen zusammen getragen worden. So soll diese Anwendung
keine Alternative, sondern eine Ergänzung der Hausnummern- und Straßenlistenauswertung von
regio-osm.de sein. Eine Verlinkung zwischen den beiden Projekte ist nach Fertigstellung
der ersten Version vorgesehen.
Das Projekt osm_address_db ermöglicht die Aufbereitung der in OSM vorhandenen
Adressdaten. Dazu wurden Shell- und SQL-Skripte entwickelt, die eine Tabellenstruktur zur
Auswertung und Analyse aufbauen.
Im Vortrag wird die Datenstruktur, benutzten Tools und Technologien von osm_address_db als
auch die während der Entwicklung aufgetretenen Probleme eingegangen. Die OSM-Daten werden
nach dem Karlsruher Schema analysiert, dabei finden auch associatedStreet-Relationen
Berücksichtigung.
Derzeit befindet sich eine Webanwendung zur Auswertung in Entwicklung.