Falten für k-fache CV in R mit Caret erstellen

8

Ich versuche, einen k-fachen CV für mehrere Klassifizierungsmethoden / Hiperparameter unter Verwendung der Daten, die bei

verfügbar sind, zu erstellen
  

Ссылка .

Dieser Satz besteht aus 208 Zeilen mit jeweils 60 Attributen. Ich lese es in einen data.frame mit der read.table-Funktion.

Der nächste Schritt besteht darin, meine Daten in k Falten zu teilen, sagen wir k = 5. Mein erster Versuch war es,

zu verwenden
  

test & lt; - createFolds (t, k = 5)

Ich hatte zwei Probleme damit. Der erste ist, dass die Längen der Falten nicht nebeneinander sind:

%Vor%      

Fold1 29 -none- numerische
  Fold2 14 -none- numerische
  Fold3 7 -none- numerische
  Fold4 5 -none- numerische
  Fold5 5 -nein- numerisch

Der andere ist, dass dies meine Daten anscheinend nach den Attributindizes aufgeteilt hat, aber ich möchte die Daten selbst aufteilen. Ich dachte das, indem ich meinen data.frame transponierte, mit:

  

test & lt; - t (myDataNumericValues)

Aber wenn ich die createFolds-Funktion aufruft, gibt es mir so etwas:

%Vor%      

Fold1 2496 -none- numerische
  Fold2 2496 -none- numerische
  Fold3 2495 -none- numerische
  Fold4 2496 -none- numerische
  Fold5 2497 - nicht numerisch

Das Längenproblem wurde gelöst, aber meine 208 Daten werden immer noch nicht geteilt.

Irgendwelche Gedanken darüber, was ich tun kann? Denken Sie, dass das Caret-Paket nicht am besten geeignet ist?

Vielen Dank im Voraus

    
gcolucci 07.04.2014, 03:46
quelle

2 Antworten

22

Bitte lesen Sie ?createFolds , um zu verstehen, was die Funktion macht. Es erzeugt die Indizes, die definieren, welche Daten durchgestrichen sind die einzelnen Falten (siehe die Optionen, um die Umkehrung zurückzugeben):

%Vor%

Um die Daten zu teilen:

%Vor%

Die Funktion train wird in diesem Paket verwendet, um die eigentliche Modellierung durchzuführen (normalerweise müssen Sie die Aufteilung nicht selbst durchführen. Siehe diese Seite ).

Max

    
topepo 07.04.2014, 13:33
quelle
1

Ich kenne das caret -Paket nicht, aber ich habe eine Funktion geschrieben, die CV basierend auf dem Entscheidungsbaum aus dem rpart -Paket berechnet. Natürlich muss die Funktion motiviert werden, um Ihrem Zweck zu entsprechen.

%Vor%

}

    
Earo Wang 07.04.2014 06:01
quelle

Tags und Links