Problematische Random Forest-Trainingslaufzeit bei Verwendung der Formelschnittstelle

Question

8

Ausführen des Zufalls-Forest-Beispiels von Ссылка , die folgende Zeile:

%Vor%

dauert Stunden (nicht sicher, ob es jemals endet, aber der Prozess scheint zu funktionieren).

Der Datensatz enthält 1128 Zeilen und ~ 7000 Variablen.

Kann man abschätzen, wann das "Random Forest" -Training endet? Kann ich R irgendwie profilieren, um mehr Informationen zu erhalten?

r performance formula machine-learning

itamarb 10.03.2013, 11:58

quelle

2 Antworten

11

Das Problem gefunden, die Verwendung der Formel in randomForest hat eine enorme Leistungseinbuße verursacht.

Weitere Informationen dazu und zum Abschätzen der zufälligen Laufzeit in der Gesamtstruktur finden Sie in: Ссылка und in Ссылка

Hier ist der endgültige Code:

%Vor%

itamarb 10.03.2013 13:58

quelle

score 6 · Accepted Answer

6

Eine Idee, um die Konvergenz zu steuern, ist die Verwendung von do.trace für einen ausführlichen Modus

%Vor%

agstudy 10.03.2013, 12:12

quelle