Ich bin immer noch relativ neu für R, also entschuldige mich im Voraus, wenn meine Frage zu einfach erscheint.
Mein Problem ist wie folgt:
Ich habe einen Datensatz mit mehreren Faktorvariablen, die die gleichen Kategorien haben. Ich muss die Kategorie finden, die am häufigsten für jede Beobachtung über die Faktorvariablen auftritt. Im Falle von Bindungen kann ein beliebiger Wert gewählt werden, obwohl es großartig wäre, wenn ich mehr Kontrolle darüber hätte.
Mein Datensatz enthält mehr als hundert Faktoren. Die Struktur ist jedoch ungefähr so:
%Vor%Die Lösung sollte eine Variable innerhalb des Datenrahmens sein, beispielsweise var5, die die häufigste Kategorie für jede Zeile enthält. Es kann ein Faktor oder ein numerischer Vektor sein (falls die Daten zuerst in numerische Vektoren konvertiert werden müssen)
In diesem Fall hätte ich gerne diese Lösung:
%Vor%Jeder Rat wird sehr geschätzt werden! Vielen Dank im Voraus!
Wenn Ihre Daten ziemlich groß sind, sollten Sie das Paket data.table
in Betracht ziehen.
Chargaffs Lösung ist einfach und funktioniert in einigen Fällen gut. Sie können mit data.table
eine kleine Leistungsverbesserung (~ 20%) erzielen.