Ich versuche, einen k-fachen CV für mehrere Klassifizierungsmethoden / Hiperparameter unter Verwendung der Daten, die bei
verfügbar sind, zu erstellenСсылка .
Dieser Satz besteht aus 208 Zeilen mit jeweils 60 Attributen. Ich lese es in einen data.frame mit der read.table-Funktion.
Der nächste Schritt besteht darin, meine Daten in k Falten zu teilen, sagen wir k = 5. Mein erster Versuch war es,
zu verwendentest & lt; - createFolds (t, k = 5)
Ich hatte zwei Probleme damit. Der erste ist, dass die Längen der Falten nicht nebeneinander sind:
%Vor%Fold1 29 -none- numerische
Fold2 14 -none- numerische
Fold3 7 -none- numerische
Fold4 5 -none- numerische
Fold5 5 -nein- numerisch
Der andere ist, dass dies meine Daten anscheinend nach den Attributindizes aufgeteilt hat, aber ich möchte die Daten selbst aufteilen. Ich dachte das, indem ich meinen data.frame transponierte, mit:
test & lt; - t (myDataNumericValues)
Aber wenn ich die createFolds-Funktion aufruft, gibt es mir so etwas:
%Vor%Fold1 2496 -none- numerische
Fold2 2496 -none- numerische
Fold3 2495 -none- numerische
Fold4 2496 -none- numerische
Fold5 2497 - nicht numerisch
Das Längenproblem wurde gelöst, aber meine 208 Daten werden immer noch nicht geteilt.
Irgendwelche Gedanken darüber, was ich tun kann? Denken Sie, dass das Caret-Paket nicht am besten geeignet ist?
Vielen Dank im Voraus
Bitte lesen Sie ?createFolds
, um zu verstehen, was die Funktion macht. Es erzeugt die Indizes, die definieren, welche Daten durchgestrichen sind die einzelnen Falten (siehe die Optionen, um die Umkehrung zurückzugeben):
Um die Daten zu teilen:
%Vor% Die Funktion train
wird in diesem Paket verwendet, um die eigentliche Modellierung durchzuführen (normalerweise müssen Sie die Aufteilung nicht selbst durchführen. Siehe diese Seite ).
Max
Tags und Links r r-caret cross-validation