R-Code, um Alter in Gruppe / Bins / Pausen zu kategorisieren

9

Ich versuche, Alter in Gruppe einzuteilen, damit es nicht kontinuierlich ist. Ich habe diesen Code:

%Vor%

Der obige Code funktioniert nicht im Survival-Paket. Es gibt mir:

%Vor%

Können Sie mir zeigen, wo der Fehler liegt? data ist der Datenrahmen, den ich verwende.

    
leian 19.10.2012, 17:34
quelle

3 Antworten

24

Ich würde findInterval() hier verwenden:

Zuerst einige Beispieldaten erstellen

%Vor%

Verwenden Sie findInterval() , um Ihren "Alters" -Vektor zu kategorisieren.

%Vor%

Alternativ, wie in den Kommentaren empfohlen, ist cut() auch hier nützlich:

%Vor%     
A5C1D2H2I1M1N2O1R2T1 19.10.2012, 17:40
quelle
8

Diese Antwort bietet zwei Möglichkeiten, das Problem mit dem Paket data.table zu lösen, wodurch die Geschwindigkeit des Prozesses erheblich verbessert wird. Dies ist entscheidend, wenn man mit großen Datensätzen arbeitet.

1s Approach : eine Anpassung der vorherigen Antwort, aber jetzt mit data.table + einschließlich labels :

%Vor%

2. Ansatz : Dies ist eine eher wortreiche Methode, aber es macht auch deutlicher, was genau in jeder Altersgruppe liegt:

%Vor%

Obwohl die beiden Ansätze dasselbe Ergebnis liefern sollten, bevorzuge ich das erste aus zwei Gründen. (a) Es ist kürzer zu schreiben und (2) die Altersgruppen sind in der richtigen Weise geordnet, was für die Visualisierung der Daten entscheidend ist.

    
rafa.pereira 22.08.2015 19:40
quelle
0

Angenommen, Ihr Alter wurde in der Datenrahmenspalte age gespeichert. Ihr Dataframe ist df , und Sie möchten eine neue Spalte age_grouping , die den "Bucket" enthält, in den Ihre Altersgruppen fallen.

Angenommen, Ihr Alter liegt zwischen 0 und & gt; 100, und Sie wollten sie alle 10 Jahre gruppieren. Der folgende Code würde dies erreichen, indem diese Intervalle in einer neuen age grouping -Spalte gespeichert werden:

%Vor%     
Marquistador 13.10.2017 17:34
quelle

Tags und Links