NaN-Werte, wenn neue Spalte zu Pandas DataFrame hinzugefügt wird

9

Ich versuche eine neue Spalte in einem Pandas DataFrame zu erzeugen, die den Werten in einem anderen Pandas DataFrame entspricht. Wenn ich versuche, die neue Spalte zu erstellen, erhalte ich nur NaNs für die neuen Spaltenwerte.

Zuerst verwende ich einen API-Aufruf, um einige Daten zu erhalten, und der "mydata" -Dataframe ist eine Spalte von Daten, die nach Datum indiziert sind

%Vor%

Der nächste DataFrame, den ich aus einer CSV-Datei mit folgendem Code erhalte, enthält viele Datenspalten mit der gleichen Anzahl von Zeilen wie 'mydata'

%Vor%

Ich versuche dann, die neue Spalte wie folgt zu generieren:

%Vor%

Auch hier bekomme ich nur NaN-Werte. Kann mir jemand helfen zu verstehen, warum es das tut und wie man es löst? Von dem, was ich gelesen habe, sieht es so aus, als ob ich etwas mit meinen Indexen falsch haben könnte. Die Indizes sind Daten in jedem Datenrahmen, aber 'mydata' haben Monatsenddaten, während 'DWDATA' Daten zum Beginn des Monats hat.

    
gtnbz2nite 06.10.2014, 17:13
quelle

1 Antwort

12

Da die Indizes nicht genau gleich sind, werden NaNs resultieren. Einer oder beide Indizes müssen entsprechend geändert werden. Beispiel:

%Vor%

Der obige Eintrag ändert den Index des 'mydata' DataFrames so, dass er mit dem Index des 'DWDATA' DataFrame übereinstimmt.

Da die Anzahl der Zeilen für die beiden DataFrames genau gleich ist, können Sie die Werte von 'mydata' auch einfach an die neue 'DWDATA' Spalte übergeben:

%Vor%     
gtnbz2nite 06.10.2014, 17:52
quelle

Tags und Links