NumPy genfromtxt: fill_missing korrekt verwenden

8

Ich versuche, in CSV gespeicherte Daten zu verarbeiten, die in einer unbekannten Anzahl von Spalten (bis zu 30) möglicherweise fehlende Werte enthalten. Ich versuche, diese fehlenden Werte mit dem Argument genfromtxt filling_missing auf '0' zu setzen. Hier ist ein minimales funktionierendes Beispiel für numpy 1.6.2 in ActiveState ActivePython 2.7 32 Bit auf Win 7.

%Vor%

Und das Ergebnis:

%Vor%

Im NumPy-Benutzerhandbuch würde ich erwarten, dass filling_values=0 und filling_values={None:0} funktionieren, aber stattdessen nicht und einen Fehler auslösen. Wenn Sie die richtige Spalte ( filling_values={1:0} ) angeben, wird es funktionieren, aber da ich eine große Anzahl von Spalten mit unbekannter Nummer vor der Auswahl durch den Benutzer habe, suche ich nach der Art, wie die gefüllten Werte automatisch gesetzt werden um.

Ich kann mir vorstellen, dass ich die Spalten wahrscheinlich im Voraus zählen kann und ein Diktat erstellen kann, das in der Zwischenzeit als Wert an filling_values ​​übergeben wird, aber gibt es einen besseren Weg?

    
Thav 28.02.2013, 19:48
quelle

1 Antwort

8

Es ist nicht offensichtlich aus der Dokumentation, aber filling_values="0" funktioniert.

%Vor%     
Warren Weckesser 28.02.2013, 21:31
quelle

Tags und Links