Ich bin komplett neu in R und tm Paket, also entschuldige bitte meine blöde Frage ;-) Wie kann ich den Text eines reinen Textkorpus im R tm-Paket anzeigen?
Ich habe einen Korpus mit 323 einfachen Textdateien in einen Korpus geladen:
%Vor%Aber wenn ich den Korpus mit:
rufe %Vor%Ich bekomme immer eine Ausgabe wie diese anstelle des Korpus-Textes selbst:
%Vor%Wie kann ich den Text des Korpus anzeigen?
Danke!
UPDATE Reproduzierbares Beispiel: Ich habe es mit dem integrierten Beispieltext versucht:
%Vor%Wie kann ich den Text der Dokumente drucken?
UPDATE 2: Sitzungsinfo:
%Vor%Sie können versuchen, Ihren Corpus-Text in einen Datenrahmen zu konvertieren und auf den erforderlichen Text aus dem Datenrahmen selbst zuzugreifen. Ich habe die eingebauten Beispieldaten "roh" (aus dem Paket tm ) als Beispiel verwendet.
%Vor%Dies funktioniert in meinem, um den Inhaltstext mit der neuesten Version von tm zu drucken,
%Vor%Hinweis: Mehr oder weniger wie von Ricky im vorherigen Kommentar vorgeschlagen. Sorry, ich wollte einen Kommentar schreiben, nur mein Rep ist nur 25 (brauche min. 50 Rep zu kommentieren).
Hier ist eine einfache und direkte Möglichkeit, den Text eines Korpus anzuzeigen:
%Vor%Für die Rohdaten wird dies ausgegeben
%Vor%Ich kann bestätigen, dass ab 0.6-1 der Inspect nicht schön gedruckt wird. Sie können es mit dem Paket qdap kombinieren, das ich leicht in ein data.frame wie folgt konvertieren kann:
%Vor%Um das alte inspect-Verhalten zu verbessern, das Sie verwenden können:
%Vor%Das sieht so aus:
%Vor%Von der tm Vignette aus funktioniert das:
writeLines(as.character(doc.corpus[[8]]))
Wobei "8" die von Ihnen gewünschte Elementnummer ist