Problem mit RandomForest & Long-Vektoren

9

Ich führe zufällige Gesamtstruktur auf einem Datensatz mit 8 numerischen Spalten (die Prädiktoren) und 1 Faktor (das Ergebnis). Im Dataset befinden sich 1,2 Millionen Zeilen. Wenn ich das tue:

randomForest(outcome.f ~ a + b + c + d + e + f + g + h,data=mdata)) , ich bekomme einen Fehler:

%Vor%

Gibt es einen Weg dies zu verhindern? Ich verstehe nicht, warum das Paket (anscheinend) versucht, einen Vektor der Länge 2 ^ 31-1 zuzuweisen. Ich benutze Mac OS X 10.9.2, mit einem Intel Core i7 (falls die Architektur wichtig ist).

Sitzungsinfo

%Vor%     
alex 13.06.2014, 00:06
quelle

2 Antworten

7

Führen Sie niemals randomforest mit zu vielen Zeilen im Trainingssatz aus.

%Vor%

Wenn Sie immer noch Fehler erhalten, versuchen Sie, die Größe des Trainingssatzes zu reduzieren (z. B. 500000 oder 100000), teilen Sie sie in rf1, rf2 und rf3, und kombinieren Sie sie dann. Hoffe es hilft.

    
dhany1024 21.10.2014 23:31
quelle
1

Sie können auch die Anzahl der Bäume (ntree) reduzieren.

    
gcamargo 13.09.2016 13:15
quelle

Tags und Links