FOSSGIS2015 - 29_2015_03_23

FOSSGIS 2015
Konferenz für freie und Open Source-Software im GIS-Bereich und für freie Geodaten

Referenten
Marc Tobias Metten
Programm
Tag Mittwoch - 2015-03-11
Raum S1
Beginn 15:30
Dauer 00:30
Info
ID 859
Veranstaltungstyp Vortrag
Track Vorträge (OSM)
Recordings

Welches Münster meinen sie?

Wie man Geocodern beibringt Orte mit gleichen Namen richtig zu sortieren

Wie sortiert man Orte nach Wichtigkeit, wenn sie den gleichen Namen haben? Wir schauen uns Daten zu Suchverhalten, Größe, Bevölkerungsdichte, Tagging in OpenStreetMap und Verlinkung in Wikipedia/Wikidata anhand des Nominatim Geocoders an.

Der Nominatim Geocoder nutzt OpenStreetMap, minütlich aktualisiert. Die Suchergebnisse werden nach Relevanz sortiert. Einige Faktoren, wie dass Ländernamen wichtiger sind als Strassennamen sind jedem klar. Auf Mailinglisten kommt aber hin und wieder die Frage auf warum genau ein Ort wichtiger eingeschätzt wird als ein anderer.

Frankfurt gibt es zweimal, beide sind grosse Städte. Münster gibt es mehrfach (http://de.wikipedia.org/wiki/M%C3%BCnster). Sogar Paris, Berlin und Frankreich sobald man die ganze Welt betrachtet.

Nominatim nutzt u.a. einen vorberechneten Score (numerischer Wert), der auf den Verlinkungen innerhalb Wikipedia basiert. Die erste Version sogar auf Seitenabrufen. Das hat Vor- und Nachteile (und Bugs). Leider sind selbst für Nutzer (Administratoren) von Nominatim die Algorithmen dahinter nicht transparent genug. Viele laden einfach eine selten aktualisierte Binärdatei von http://www.nominatim.org/.

Ich habe mich damit intensiver beschäftigt und plane bis zur FOSSGIS die Scripte neu schreiben und neu dokumentieren. Selbst wenn nicht wird der Vortrag ein guter Überlick werden. Ich arbeite bei http://data.opencagedata.com/index.html#about-section und wir bieten einen Geocoder u.a. auf Basis von Nominatim an http://geocoder.opencagedata.com/. Ich arbeite seit 2006 Jahren mit geocodern mit underschiedlichen kommerziellen und offenen Daten.

Privat wohne ich in Münster und freue mich nicht nach Karlsruhe (state of the map) oder Berlin (FOSSGIS 2014, wherecamp) reisen zu müssen.