So finden Sie die häufigsten Werte für mehrere Spalten mit Faktoren

8

Ich bin immer noch relativ neu für R, also entschuldige mich im Voraus, wenn meine Frage zu einfach erscheint.

Mein Problem ist wie folgt:

Ich habe einen Datensatz mit mehreren Faktorvariablen, die die gleichen Kategorien haben. Ich muss die Kategorie finden, die am häufigsten für jede Beobachtung über die Faktorvariablen auftritt. Im Falle von Bindungen kann ein beliebiger Wert gewählt werden, obwohl es großartig wäre, wenn ich mehr Kontrolle darüber hätte.

Mein Datensatz enthält mehr als hundert Faktoren. Die Struktur ist jedoch ungefähr so:

%Vor%

Die Lösung sollte eine Variable innerhalb des Datenrahmens sein, beispielsweise var5, die die häufigste Kategorie für jede Zeile enthält. Es kann ein Faktor oder ein numerischer Vektor sein (falls die Daten zuerst in numerische Vektoren konvertiert werden müssen)

In diesem Fall hätte ich gerne diese Lösung:

%Vor%

Jeder Rat wird sehr geschätzt werden! Vielen Dank im Voraus!

    
ZMacarozzi 14.11.2013, 16:26
quelle

2 Antworten

13

Etwas wie:

%Vor%

Falls es einen Gleichstand gibt, welcher max. Wert den ersten Maximalwert annimmt. Von dem which.max Hilfeseite:

  

Bestimmt den Ort, d. h. den Index des (ersten)   Minimum oder Maximum eines numerischen Vektors.

Beispiel:

%Vor%     
Chargaff 14.11.2013, 16:34
quelle
0

Wenn Ihre Daten ziemlich groß sind, sollten Sie das Paket data.table in Betracht ziehen.

%Vor%

Chargaffs Lösung ist einfach und funktioniert in einigen Fällen gut. Sie können mit data.table eine kleine Leistungsverbesserung (~ 20%) erzielen.

%Vor%     
janosdivenyi 18.02.2016 14:11
quelle

Tags und Links