corpus

Ein Korpus bezieht sich meistens auf eine Sammlung von strukturiertem Text. Bitte denken Sie daran, Ihre Frage auf https://opendata.stackexchange.com zu stellen, wenn Ihre Frage nicht eng mit der Problemlösung zusammenhängt oder Sie nur nach einem frei verfügbaren Korpus für jeden Zweck suchen.
7
Antworten

Wie wird Korpus Text im R tm Paket angezeigt?

Ich bin komplett neu in R und tm Paket, also entschuldige bitte meine blöde Frage ;-) Wie kann ich den Text eines reinen Textkorpus im R tm-Paket anzeigen? Ich habe einen Korpus mit 323 einfachen Textdateien in einen Korpus geladen: %Vor%...
25.05.2015, 09:25
2
Antworten

R tm removeWords Funktion entfernt keine Wörter

Ich versuche einige Wörter aus einem Korpus zu entfernen, das ich gebaut habe, aber es scheint nicht zu funktionieren. Ich durchlaufe zuerst alles und erstelle einen Datenrahmen, der meine Wörter in der Reihenfolge ihrer Häufigkeit auflistet. Ic...
26.08.2015, 11:44
1
Antwort

Belegnummer mit R-Korpus behalten

Ich habe stackoverflow und das Web durchsucht und finde nur Teillösungen ODER einige, die aufgrund von Änderungen in TM oder qdap nicht funktionieren. Problem unten: Ich habe einen Datenrahmen: ID und Text (Einfaches Dokument id / name...
01.07.2014, 02:07
1
Antwort

Korpus / Datensatz von englischen Wörtern mit Silbenspannungsinformationen?

Ich weiß, dass dies eine lange Geschichte ist, aber kennt jemand einen Datensatz mit englischen Wörtern, der Informationen nach Silben enthält? Etwas so einfaches wie das Folgende wäre fantastisch: %Vor%     
15.05.2010, 09:05
3
Antworten

Erstellen eines neuen Korpus mit NLTK

Ich vermutete, dass die Antwort auf meinen Titel oft darin besteht, die Dokumentationen zu lesen, aber ich habe das NLTK-Buch durchgelesen es gibt keine Antwort. Ich bin etwas neu bei Python. Ich habe eine Menge .txt -Dateien und möchte...
09.02.2011, 23:19