information-extraction

Informationsextraktion (IE) ist die Aufgabe, strukturierte Informationen automatisch aus unstrukturierten und / oder halbstrukturierten maschinenlesbaren Dokumenten zu extrahieren. In den meisten Fällen handelt es sich um die Verarbeitung von Texten in menschlicher Sprache mittels natürlicher Sprachverarbeitung (NLP). Jüngste Aktivitäten in der Verarbeitung von Multimedia-Dokumenten wie automatische Annotation und Inhaltsextraktion aus Bildern / Audio / Video könnten als Informationsextraktion angesehen werden.
2
Antworten

Welches Phrasenextrahierungswerkzeug ist jetzt der Stand der Technik?

Ich kenne die folgenden Open-Source-Tools, aber ich habe keine Vergleiche darüber gefunden, wie gut sie jeweils sind. Werkzeuge mit gebrauchsfertiger Phrasenextraktion: KEA MAUI (http://code.google.com/p/maui-indexer/) Dragon, xTract (ht...
24.03.2012, 17:48