Ermitteln geografischer Orte im Text

8

Welche Art von Arbeit wurde unternommen, um festzustellen, ob eine bestimmte Zeichenfolge zu einem geografischen Ort gehört? Zum Beispiel:

%Vor%

Ich vermute, dass ich eine Art statistischen Ansatz erwarte, der ein gewisses Maß an Vertrauen gibt, dass die ersten beiden Standorte sind. Letzteres würde wahrscheinlich eine Heuristik erfordern, die "% s,% s" ergreift und dann die gleiche Technik verwendet. Ich suche speziell nach Ansätzen, die sich nicht zu sehr auf den Satz "in" verlassen, da es kein ganz eindeutiger oder durchgängig verfügbarer Standortindikator ist.

Kann mir jemand auf Ansätze, Papiere oder vorhandene Hilfsmittel hinweisen? Danke!

    
Robert Elwell 29.07.2009, 15:08
quelle

4 Antworten

7

Das von Ihnen beschriebene Problem wird häufig als geographische Abfrageanalyse oder allgemein als geographische Informationsabfrage bezeichnet.

Es gab kürzlich eine Aufgabe auf der CLEF 2007 ( Ссылка ). Das Gewinnerteam verwendete eine regelbasierte Grammatik, die ähnlich zu dem ist, was Sie wahrscheinlich nicht wollen. Ein weiteres Paper auf www2009 spricht über GeoParser: Ссылка .

Es gibt auch einige Artikel zu Geographic Information Retrieval auf der CIKM 2007: Ссылка

Ich kenne keine Open-Source-Software, die das tut, aber es kann in eine Suchmaschine wie Lemur gebündelt werden.

    
ealdent 29.07.2009, 19:08
quelle
4
___ qstnhdr ___ Ermitteln geografischer Orte im Text ___ answer1202401 ___

Das von Ihnen beschriebene Problem wird häufig als geographische Abfrageanalyse oder allgemein als geographische Informationsabfrage bezeichnet.

Es gab kürzlich eine Aufgabe auf der CLEF 2007 ( Ссылка ). Das Gewinnerteam verwendete eine regelbasierte Grammatik, die ähnlich zu dem ist, was Sie wahrscheinlich nicht wollen. Ein weiteres Paper auf www2009 spricht über GeoParser: Ссылка .

Es gibt auch einige Artikel zu Geographic Information Retrieval auf der CIKM 2007: Ссылка

Ich kenne keine Open-Source-Software, die das tut, aber es kann in eine Suchmaschine wie Lemur gebündelt werden.

    
___ tag123nlp ___ Natural Language Processing (NLP) ist ein Teilbereich der künstlichen Intelligenz, bei dem nützliche Informationen aus natürlichsprachlichen Daten transformiert oder extrahiert werden. Methoden umfassen maschinelles Lernen und regelbasierte Ansätze. ___ answer1201093 ___

Ein Link zur Hilfe: geonames.org Suche :

  

gibt die Namen zurück, die für die gefunden wurden   Suchbegriff als XML- oder JSON-Dokument

Beispiel: Ссылка

    
___ answer38510537 ___

Ich baue einen kostenlosen Geoparser bei geocode.xyz

(unterstützt derzeit etwa 50 europäische Länder, die bald weltweite Berichterstattung anbieten werden)

Eine Beispielanwendung von Geoparsing finden Sie auf OpenWikiMap

    
___ tag123geography ___ Geographie ist die Wissenschaft, die sich mit dem Studium der Erde und ihrer Länder, Merkmale, Bewohner und Phänomene befasst. ___ qstntxt ___

Welche Art von Arbeit wurde unternommen, um festzustellen, ob eine bestimmte Zeichenfolge zu einem geografischen Ort gehört? Zum Beispiel:

%Vor%

Ich vermute, dass ich eine Art statistischen Ansatz erwarte, der ein gewisses Maß an Vertrauen gibt, dass die ersten beiden Standorte sind. Letzteres würde wahrscheinlich eine Heuristik erfordern, die "% s,% s" ergreift und dann die gleiche Technik verwendet. Ich suche speziell nach Ansätzen, die sich nicht zu sehr auf den Satz "in" verlassen, da es kein ganz eindeutiger oder durchgängig verfügbarer Standortindikator ist.

Kann mir jemand auf Ansätze, Papiere oder vorhandene Hilfsmittel hinweisen? Danke!

    
___ antwort1210053 ___

Es gibt einen sehr interessanten Ansatz von Everyblock.com, der sich darauf konzentriert, wie Standorte in Englisch ausgedrückt werden - sie verwenden im Grunde einige ausgefeilte und umfangreiche reguläre Ausdrücke, die jetzt Open Source sind. Ihre Anwendung wurde entwickelt, um Nachrichtenartikel, Rezensionen und verschiedene öffentliche Datenfeeds zu durchsuchen und sie mit bestimmten Standorten in Beziehung zu setzen, und es funktioniert gut. Ausdrücke wie "Ein Feuer im Gebäude an der Nord-Ost-Ecke des 20. und Valencia St. in San Francisco" sind sehr genau geocodiert. Sie können die Quelle hier studieren. Der Teil, den Sie wahrscheinlich wollen, ist ebpub/ebpub/geocoder/base.py , befindet sich im ebpub -Download und alles um ihn herum, zum Beispiel mit der SmartGeocoder-Klasse zu beginnen und rückwärts zu arbeiten.

    
___
unmounted 31.07.2009 00:09
quelle
3

Ein Link zur Hilfe: geonames.org Suche :

  

gibt die Namen zurück, die für die gefunden wurden   Suchbegriff als XML- oder JSON-Dokument

Beispiel: Ссылка

    
Pierre 29.07.2009 15:25
quelle
0

Ich baue einen kostenlosen Geoparser bei geocode.xyz

(unterstützt derzeit etwa 50 europäische Länder, die bald weltweite Berichterstattung anbieten werden)

Eine Beispielanwendung von Geoparsing finden Sie auf OpenWikiMap

    
Ervin Ruci 21.07.2016 17:18
quelle

Tags und Links