Problematische Random Forest-Trainingslaufzeit bei Verwendung der Formelschnittstelle

8

Ausführen des Zufalls-Forest-Beispiels von Ссылка , die folgende Zeile:

%Vor%

dauert Stunden (nicht sicher, ob es jemals endet, aber der Prozess scheint zu funktionieren).

Der Datensatz enthält 1128 Zeilen und ~ 7000 Variablen.

Kann man abschätzen, wann das "Random Forest" -Training endet? Kann ich R irgendwie profilieren, um mehr Informationen zu erhalten?

    
itamarb 10.03.2013, 11:58
quelle

2 Antworten

6

Eine Idee, um die Konvergenz zu steuern, ist die Verwendung von do.trace für einen ausführlichen Modus

%Vor%     
agstudy 10.03.2013, 12:12
quelle
11

Das Problem gefunden, die Verwendung der Formel in randomForest hat eine enorme Leistungseinbuße verursacht.

Weitere Informationen dazu und zum Abschätzen der zufälligen Laufzeit in der Gesamtstruktur finden Sie in: Ссылка und in Ссылка

Hier ist der endgültige Code:

%Vor%     
itamarb 10.03.2013 13:58
quelle