Vorhersage fehlender Werte mit dem Imputer-Modul von scikit-learn

10

Ich schreibe ein sehr einfaches Programm, um fehlende Werte in einem Datensatz mit scikit-learn's Imputer Klasse vorherzusagen.

Ich habe ein NumPy-Array erstellt, ein Imputer-Objekt mit strategy = 'mean' erstellt und fit_transform () für das NumPy-Array ausgeführt.

Wenn ich das Array nach der Ausführung von fit_transform () drucke, bleiben die Nan's erhalten, und ich bekomme keine Vorhersage.

Was mache ich hier falsch? Wie kann ich die fehlenden Werte vorhersagen?

%Vor%     
xennygrimmato 29.07.2014, 14:16
quelle

1 Antwort

14

Per die Dokumentation , sklearn.preprocessing.Imputer.fit_transform gibt ein neues Array zurück, es ändert nicht das Argumentarray. Die minimale Lösung ist daher:

%Vor%     
jonrsharpe 29.07.2014, 14:20
quelle