___ qstnhdr ___ Ermitteln geografischer Orte im Text
___ answer1202401 ___
Das von Ihnen beschriebene Problem wird häufig als geographische Abfrageanalyse oder allgemein als geographische Informationsabfrage bezeichnet.
Es gab kürzlich eine Aufgabe auf der CLEF 2007 ( Ссылка ). Das Gewinnerteam verwendete eine regelbasierte Grammatik, die ähnlich zu dem ist, was Sie wahrscheinlich nicht wollen. Ein weiteres Paper auf www2009 spricht über GeoParser: Ссылка .
Es gibt auch einige Artikel zu Geographic Information Retrieval auf der CIKM 2007: Ссылка
Ich kenne keine Open-Source-Software, die das tut, aber es kann in eine Suchmaschine wie Lemur gebündelt werden.
___ tag123nlp ___ Natural Language Processing (NLP) ist ein Teilbereich der künstlichen Intelligenz, bei dem nützliche Informationen aus natürlichsprachlichen Daten transformiert oder extrahiert werden. Methoden umfassen maschinelles Lernen und regelbasierte Ansätze.
___ answer1201093 ___
Ein Link zur Hilfe: geonames.org Suche :
gibt die Namen zurück, die für die gefunden wurden
Suchbegriff als XML- oder JSON-Dokument
Beispiel: Ссылка
___ answer38510537 ___
Ich baue einen kostenlosen Geoparser bei geocode.xyz
(unterstützt derzeit etwa 50 europäische Länder, die bald weltweite Berichterstattung anbieten werden)
Eine Beispielanwendung von Geoparsing finden Sie auf OpenWikiMap
___ tag123geography ___ Geographie ist die Wissenschaft, die sich mit dem Studium der Erde und ihrer Länder, Merkmale, Bewohner und Phänomene befasst.
___ qstntxt ___
Welche Art von Arbeit wurde unternommen, um festzustellen, ob eine bestimmte Zeichenfolge zu einem geografischen Ort gehört? Zum Beispiel:
%Vor%
Ich vermute, dass ich eine Art statistischen Ansatz erwarte, der ein gewisses Maß an Vertrauen gibt, dass die ersten beiden Standorte sind. Letzteres würde wahrscheinlich eine Heuristik erfordern, die "% s,% s" ergreift und dann die gleiche Technik verwendet. Ich suche speziell nach Ansätzen, die sich nicht zu sehr auf den Satz "in" verlassen, da es kein ganz eindeutiger oder durchgängig verfügbarer Standortindikator ist.
Kann mir jemand auf Ansätze, Papiere oder vorhandene Hilfsmittel hinweisen? Danke!
___ antwort1210053 ___
Es gibt einen sehr interessanten Ansatz von Everyblock.com, der sich darauf konzentriert, wie Standorte in Englisch ausgedrückt werden - sie verwenden im Grunde einige ausgefeilte und umfangreiche reguläre Ausdrücke, die jetzt Open Source sind. Ihre Anwendung wurde entwickelt, um Nachrichtenartikel, Rezensionen und verschiedene öffentliche Datenfeeds zu durchsuchen und sie mit bestimmten Standorten in Beziehung zu setzen, und es funktioniert gut. Ausdrücke wie "Ein Feuer im Gebäude an der Nord-Ost-Ecke des 20. und Valencia St. in San Francisco" sind sehr genau geocodiert. Sie können die Quelle hier studieren. Der Teil, den Sie wahrscheinlich wollen, ist ebpub/ebpub/geocoder/base.py
, befindet sich im ebpub
-Download und alles um ihn herum, zum Beispiel mit der SmartGeocoder-Klasse zu beginnen und rückwärts zu arbeiten.
___