Wie wird Korpus Text im R tm Paket angezeigt?

8

Ich bin komplett neu in R und tm Paket, also entschuldige bitte meine blöde Frage ;-) Wie kann ich den Text eines reinen Textkorpus im R tm-Paket anzeigen?

Ich habe einen Korpus mit 323 einfachen Textdateien in einen Korpus geladen:

%Vor%

Aber wenn ich den Korpus mit:

rufe %Vor%

Ich bekomme immer eine Ausgabe wie diese anstelle des Korpus-Textes selbst:

%Vor%

Wie kann ich den Text des Korpus anzeigen?

Danke!

UPDATE Reproduzierbares Beispiel: Ich habe es mit dem integrierten Beispieltext versucht:

%Vor%

Wie kann ich den Text der Dokumente drucken?

UPDATE 2: Sitzungsinfo:

%Vor%     
Azrael 25.05.2015, 09:25
quelle

7 Antworten

10

Sie können versuchen, Ihren Corpus-Text in einen Datenrahmen zu konvertieren und auf den erforderlichen Text aus dem Datenrahmen selbst zuzugreifen. Ich habe die eingebauten Beispieldaten "roh" (aus dem Paket tm ) als Beispiel verwendet.

%Vor%     
Analytical Monk 25.05.2015, 10:58
quelle
32

Dies funktioniert in meinem, um den Inhaltstext mit der neuesten Version von tm zu drucken,

%Vor%

Hinweis: Mehr oder weniger wie von Ricky im vorherigen Kommentar vorgeschlagen. Sorry, ich wollte einen Kommentar schreiben, nur mein Rep ist nur 25 (brauche min. 50 Rep zu kommentieren).

    
silo 30.06.2015 03:30
quelle
6

Hier ist eine einfache und direkte Möglichkeit, den Text eines Korpus anzuzeigen:

%Vor%

Für die Rohdaten wird dies ausgegeben

%Vor%     
S. Elzwawi 25.03.2016 10:58
quelle
3

Ich kann bestätigen, dass ab 0.6-1 der Inspect nicht schön gedruckt wird. Sie können es mit dem Paket qdap kombinieren, das ich leicht in ein data.frame wie folgt konvertieren kann:

%Vor%

Um das alte inspect-Verhalten zu verbessern, das Sie verwenden können:

%Vor%

Das sieht so aus:

%Vor%     
Tyler Rinker 25.05.2015 14:27
quelle
1

Wir können die content jedes Elements im Korpus abrufen.

%Vor%     
Selva 19.08.2016 11:22
quelle
0
%Vor%     
Ricky 25.05.2015 09:53
quelle
-1

Von der tm Vignette aus funktioniert das:

writeLines(as.character(doc.corpus[[8]]))

Wobei "8" die von Ihnen gewünschte Elementnummer ist

    
Barry DeCicco 14.07.2016 00:09
quelle

Tags und Links