Ich habe einige unbenannte Microblogging-Posts und möchte ein Sentiment-Analyse-Modul erstellen.
Um dies zu tun, habe ich versucht Stanford Bibliothek und Alchemy Api Web-Service, aber das Ergebnis ist nicht sehr gut. Fürs Erste möchte ich meinen Klassifikator nicht trainieren.
Also möchte ich mir einige Bibliotheken oder einige Webdienste dazu vorschlagen. Ich würde eine getestete Bibliothek bevorzugen. Die Sprache dieser Beiträge ist Englisch. Auch die Vorverarbeitung wurde durchgeführt.
P.S.
Die Programmiersprache, die ich verwende, ist Java EE
Wenn Sie einen guten Stimmungsanalyse-Service wünschen und nicht Ihren eigenen Klassifikator trainieren möchten, müssen Sie dafür bezahlen. Es ist jedoch erwähnenswert, dass keine perfekten Werkzeuge in diesem Bereich existieren. Es gibt keine Werkzeuge, die 100% Genauigkeit bei der Analyse garantieren.
Nachdem ich das gesagt habe, habe ich vor ein paar Monaten mit Semantria / Lexalytics herumgespielt. Sie haben ein einfaches Java SDK und eine gute Genauigkeit in ihren Sentimentanalyse-Ergebnissen.
Stimmungsanalyse hält nicht mit den gehypten Versprechen Schritt.
Siehe z.B.
Der traurige Zustand der Gefühlsanalyse
26. Dezember 2013 von Angela Hausman - Ссылка
Jüngste Experimente legen nahe, dass Stimmungsanalysen weniger akkurat sind als ein Münzwurf (Genauigkeit 50%). Das ist wirklich gruselig, wenn Ihre Marke strategische Entscheidungen auf der Grundlage einer Stimmungsanalyse trifft.
...
Während die Werkzeuge zwischen 60 und 80% der Äußerungen genau vorhersagten, fiel die Genauigkeit bei der Entfernung neutraler Äußerungen (80% der Äußerungen) alarmierend ab.
Mit anderen Worten, jeder betrügt seine Benchmarks und Überanpassungen (z. B. Tweets haben Tonnen von Duplikaten und Beinahe-Duplikaten - Retweets - wenn Sie diese einschließen, überschätzen Sie die tatsächliche Leistung)
LingPipe ist ein kostenloses (sowie kostenpflichtiges) Tool, das für die Sentiment-Analyse zur Verfügung steht. Ссылка
Hauptmerkmale sind:
Stimmungsanalyse
Benannte Entitätserkennung
Clustering
Topic-Klassifizierung
Spracherkennung
usw.
Tags und Links java machine-learning text-mining data-mining sentiment-analysis