So finden Sie die häufigsten Werte für mehrere Spalten mit Faktoren

Question

So finden Sie die häufigsten Werte für mehrere Spalten mit Faktoren

8

Ich bin immer noch relativ neu für R, also entschuldige mich im Voraus, wenn meine Frage zu einfach erscheint.

Mein Problem ist wie folgt:

Ich habe einen Datensatz mit mehreren Faktorvariablen, die die gleichen Kategorien haben. Ich muss die Kategorie finden, die am häufigsten für jede Beobachtung über die Faktorvariablen auftritt. Im Falle von Bindungen kann ein beliebiger Wert gewählt werden, obwohl es großartig wäre, wenn ich mehr Kontrolle darüber hätte.

Mein Datensatz enthält mehr als hundert Faktoren. Die Struktur ist jedoch ungefähr so:

%Vor%

Die Lösung sollte eine Variable innerhalb des Datenrahmens sein, beispielsweise var5, die die häufigste Kategorie für jede Zeile enthält. Es kann ein Faktor oder ein numerischer Vektor sein (falls die Daten zuerst in numerische Vektoren konvertiert werden müssen)

In diesem Fall hätte ich gerne diese Lösung:

%Vor%

Jeder Rat wird sehr geschätzt werden! Vielen Dank im Voraus!

r factors mode

ZMacarozzi 14.11.2013, 16:26

quelle

2 Antworten

0

Wenn Ihre Daten ziemlich groß sind, sollten Sie das Paket data.table in Betracht ziehen.

%Vor%

Chargaffs Lösung ist einfach und funktioniert in einigen Fällen gut. Sie können mit data.table eine kleine Leistungsverbesserung (~ 20%) erzielen.

%Vor%

janosdivenyi 18.02.2016 14:11

quelle

Tags und Links r factors mode

Django: Verwenden von Annotate, Count und Distinct in einem Queryset Wo kann ActiveMQ-Hostname manuell konfiguriert werden?

score 13 · Accepted Answer

Etwas wie:

%Vor%

Falls es einen Gleichstand gibt, welcher max. Wert den ersten Maximalwert annimmt. Von dem which.max Hilfeseite:

Bestimmt den Ort, d. h. den Index des (ersten) Minimum oder Maximum eines numerischen Vektors.

Beispiel:

%Vor%