Ich führe zufällige Gesamtstruktur auf einem Datensatz mit 8 numerischen Spalten (die Prädiktoren) und 1 Faktor (das Ergebnis). Im Dataset befinden sich 1,2 Millionen Zeilen. Wenn ich das tue:
randomForest(outcome.f ~ a + b + c + d + e + f + g + h,data=mdata))
, ich bekomme einen Fehler:
Gibt es einen Weg dies zu verhindern? Ich verstehe nicht, warum das Paket (anscheinend) versucht, einen Vektor der Länge 2 ^ 31-1 zuzuweisen. Ich benutze Mac OS X 10.9.2, mit einem Intel Core i7 (falls die Architektur wichtig ist).
Sitzungsinfo
%Vor%Führen Sie niemals randomforest mit zu vielen Zeilen im Trainingssatz aus.
%Vor%Wenn Sie immer noch Fehler erhalten, versuchen Sie, die Größe des Trainingssatzes zu reduzieren (z. B. 500000 oder 100000), teilen Sie sie in rf1, rf2 und rf3, und kombinieren Sie sie dann. Hoffe es hilft.
Tags und Links r random-forest