tm

Das Paket 'tm' (Kurzform für Text Mining Infrastructure in R) bietet ein Framework für Text Mining-Anwendungen innerhalb von R.
1
Antwort

Textkategorisierung in R

Mein Ziel ist es, die Feedback-E-Mail automatisch an die jeweilige Abteilung weiterzuleiten. Meine Felder sind FNUMBER , CATEGORY , SUBCATEGORY , Description . Ich habe die letzten 6 Monate Daten im obigen Format - wobei die gesamte Em...
10.03.2014, 04:35
7
Antworten

Wie wird Korpus Text im R tm Paket angezeigt?

Ich bin komplett neu in R und tm Paket, also entschuldige bitte meine blöde Frage ;-) Wie kann ich den Text eines reinen Textkorpus im R tm-Paket anzeigen? Ich habe einen Korpus mit 323 einfachen Textdateien in einen Korpus geladen: %Vor%...
25.05.2015, 09:25
4
Antworten

stemCompletion funktioniert nicht

Ich verwende tm-Paket für die Textanalyse von Reparaturdaten, das Lesen von Daten in Datenrahmen, das Konvertieren in Corpus-Objekte, verschiedene Methoden zum Löschen von Daten mit low, stipWhitespace, RemoveStopwords und so weiter. Zurückge...
08.08.2014, 14:39
2
Antworten

R tm removeWords Funktion entfernt keine Wörter

Ich versuche einige Wörter aus einem Korpus zu entfernen, das ich gebaut habe, aber es scheint nicht zu funktionieren. Ich durchlaufe zuerst alles und erstelle einen Datenrahmen, der meine Wörter in der Reihenfolge ihrer Häufigkeit auflistet. Ic...
26.08.2015, 11:44
1
Antwort

Belegnummer mit R-Korpus behalten

Ich habe stackoverflow und das Web durchsucht und finde nur Teillösungen ODER einige, die aufgrund von Änderungen in TM oder qdap nicht funktionieren. Problem unten: Ich habe einen Datenrahmen: ID und Text (Einfaches Dokument id / name...
01.07.2014, 02:07
2
Antworten

R Die DocumentTermMatrix-Kontrollliste funktioniert nicht, ignoriert unbekannte Parameter stillschweigend

Ich habe zwei folgende DTM-s: %Vor% Wenn ich das implementiere, sehe ich zwei gleiche DTMs und wenn ich dtmImproved öffne, gibt es Wörter mit 3 Symbolen. Warum funktioniert der Parameter minWordLength nicht? Danke! %Vor%     
13.11.2012, 18:54