Pandas: Berechne Mittelwert oder Standard (Standardabweichung) über den gesamten Datenrahmen

11

Hier ist mein Problem, ich habe einen Datenrahmen wie folgt:

%Vor%

und ich möchte nur den Mittelwert über den gesamten Datenrahmen berechnen, da das Folgende nicht funktioniert:

%Vor%

Dann kam ich auf:

%Vor%

Aber dieser Trick wird nicht funktionieren, um die Standardabweichung zu berechnen. Meine letzten Versuche waren:

%Vor%

Außer dass im letzteren Fall die Funktion mean () und std () von numpy verwendet wird. Es ist kein Problem für den Mittelwert, aber es ist für std, da die Pandas-Funktion standardmäßig ddof=1 verwendet, im Gegensatz zu der numpigen, wo ddof=0 .

    
jrjc 05.08.2014, 14:14
quelle

3 Antworten

20

Sie könnten den Datenrahmen in eine einzelne Spalte mit stack umwandeln (dies ändert die Form von 5x3 nach 15x1) und dann die Standardabweichung nehmen:

%Vor%

Alternativ können Sie values verwenden, um von einem Pandas-Datenfeld in ein numpliges Array zu konvertieren, bevor Sie die Standardabweichung verwenden:

%Vor%

Beachten Sie, dass (im Gegensatz zu Pandas) numpy standardmäßig die Standardabweichung des gesamten Arrays angibt, so dass vor der Standardabweichung keine Umformung erforderlich ist.

    
JohnE 05.08.2014, 16:39
quelle
0

df.mean(0) kann Ihnen geben, wonach Sie suchen. df.std(0) funktioniert auch.

    
FerYepes 27.07.2017 20:56
quelle
-2

Vielleicht möchten Sie df.describe () Ich denke, es macht was Sie wollen Ссылка

    
dartdog 05.08.2014 15:53
quelle

Tags und Links