Histogramm in der Pandas-Spalte

8

Ich versuche ein Histogramm auf einer kontinuierlichen Wertspalte in Pandas zu erstellen. Schrieb den folgenden Code:

%Vor%

Aber ich bin mir nicht sicher, warum alle Werte den gleichen Frequenzverlauf ergeben, der nicht der Fall sein sollte. Irgendwelche falschen mit dem Code?

Testdaten:

%Vor%

%Vor%

Nach 100 Behältern:

    
Baktaawar 27.02.2017, 21:56
quelle

2 Antworten

13

Eine schnelle Wiederholung Ihrer Daten:

%Vor%

Druckt absolut einwandfrei aus.

Die Funktion df.hist wird mit einem optionalen Schlüsselwortargument bins=10 geliefert, das die Daten in einzelne Bins gruppiert. Mit nur 10 diskreten Bins und einer mehr oder weniger homogenen Verteilung von Hunderttausenden von Zeilen können Sie den Unterschied in den zehn verschiedenen Bins in Ihrem Diagramm mit niedriger Auflösung möglicherweise nicht sehen:

%Vor%

BEARBEITEN:

Nach Ihren Kommentaren macht das wirklich Sinn. Es gibt 1,4 Millionen Zeilen und zehn diskrete Buckets. Also anscheinend ist jeder Eimer genau 10% (zu was man in der Handlung sehen kann)

    
Sebastian Wozny 27.02.2017 22:31
quelle
1

Hier ist eine andere Möglichkeit, die Daten zu plotten. Dazu gehört, date_time in einen Index zu verwandeln, was Ihnen beim späteren Slicen helfen könnte.

%Vor%     
Gary Nobles 27.02.2017 23:07
quelle

Tags und Links