text-mining

Text Mining ist ein Prozess zum Ableiten von qualitativ hochwertigen Informationen aus unstrukturierten (textuellen) Informationen.
3
Antworten

Wie erkennt man Ideen und Konzepte in einem bestimmten Text?

Ich arbeite gerade an einem Projekt, wo es wirklich nützlich wäre, wenn ein bestimmtes Thema / eine Idee in einem Textteil erwähnt wird. Zum Beispiel, wenn der Text enthalten:    Vielleicht, wenn Sie mir ein wenig mehr darüber erzählen, wer...
17.05.2010, 22:38
1
Antwort

Font-Problem auf dem Ubuntu-Rechner beim Parsen von PDF-Dateien

Ich habe eine Anwendung auf meinem Ubuntu 14.04.x-Rechner. Diese Anwendung führt Text-Mining für PDF-Dateien durch. Ich vermute, dass es Apache Tika usw. verwendet ... Das Problem ist, dass ich während des Leseprozesses folgende Warnung bekom...
10.09.2015, 18:24
1
Antwort

Textkategorisierung in R

Mein Ziel ist es, die Feedback-E-Mail automatisch an die jeweilige Abteilung weiterzuleiten. Meine Felder sind FNUMBER , CATEGORY , SUBCATEGORY , Description . Ich habe die letzten 6 Monate Daten im obigen Format - wobei die gesamte Em...
10.03.2014, 04:35
6
Antworten

Wie lies ich Zeilen in einer Textdatei nur nach einer bestimmten Zeichenfolge mit Python?

Mit Python möchte ich alle Zeilen in einer Textdatei, die hinter einer bestimmten Zeichenfolge stehen, in ein Wörterbuch einlesen. Ich möchte das über Tausende von Textdateien machen. Ich bin in der Lage, die bestimmte Zeichenfolge ("Abstract...
06.01.2015, 19:37
7
Antworten

Visualisieren Sie Abstände zwischen Texten

Ich arbeite an einem Forschungsprojekt für die Schule. Ich habe eine Text-Mining-Software geschrieben, die Rechtstexte in einer Sammlung analysiert und eine Punktzahl ausspuckt, die angibt, wie ähnlich sie sind. Ich habe das Programm ausgeführt,...
14.04.2013, 21:57
2
Antworten

So finden Sie mithilfe von word2vec das nächste Wort zu einem Vektor

Ich habe gerade begonnen, Word2vec zu verwenden, und ich frage mich, wie wir das nächste Wort zu einem Vektor finden können.  Ich habe diesen Vektor, der der durchschnittliche Vektor für eine Menge von Vektoren ist: %Vor% Gibt es einen direk...
24.09.2015, 11:03
2
Antworten

R tm removeWords Funktion entfernt keine Wörter

Ich versuche einige Wörter aus einem Korpus zu entfernen, das ich gebaut habe, aber es scheint nicht zu funktionieren. Ich durchlaufe zuerst alles und erstelle einen Datenrahmen, der meine Wörter in der Reihenfolge ihrer Häufigkeit auflistet. Ic...
26.08.2015, 11:44
1
Antwort

Belegnummer mit R-Korpus behalten

Ich habe stackoverflow und das Web durchsucht und finde nur Teillösungen ODER einige, die aufgrund von Änderungen in TM oder qdap nicht funktionieren. Problem unten: Ich habe einen Datenrahmen: ID und Text (Einfaches Dokument id / name...
01.07.2014, 02:07
2
Antworten

Wie kann man von R auf Wikipedia zugreifen?

Gibt es ein Paket für R, mit dem Wikipedia abgefragt werden kann (höchstwahrscheinlich mit der Mediawiki-API), um eine Liste der für diese Abfrage relevanten Artikel zu erhalten, sowie ausgewählte Artikel für Text-Mining zu importieren?     
23.05.2011, 10:28
4
Antworten

Sentimentanalyse-Java-Bibliothek

Ich habe einige unbenannte Microblogging-Posts und möchte ein Sentiment-Analyse-Modul erstellen. Um dies zu tun, habe ich versucht Stanford Bibliothek und Alchemy Api Web-Service, aber das Ergebnis ist nicht sehr gut. Fürs Erste möchte ic...
15.11.2014, 18:32