Zufalls-Beispiel einer Teilmenge eines Datenrahmens in Pandas

8

Angenommen, ich habe einen Datenrahmen mit 100.000 Einträgen und möchte ihn in 100 Abschnitte von 1000 Einträgen aufteilen.

Wie nehme ich eine zufällige Stichprobe von etwa Größe 50 von nur einem der 100 Abschnitte. Der Datensatz ist bereits so geordnet, dass die ersten 1000 Ergebnisse der erste Abschnitt, der nächste Abschnitt der nächste usw. sind.

vielen Dank

    
WGP 28.06.2016, 20:17
quelle

2 Antworten

10

Sie können die sample -Methode *: %Vor%

* Auf einem der Abschnitt DataFrames.

Hinweis: Wenn Sie eine größere Stichprobengröße als die Größe des Datenrahmens haben, wird dies zu einem Fehler führen, es sei denn, Sie probieren mit Ersatz.

%Vor%     
Andy Hayden 28.06.2016 20:39
quelle
4

Eine Lösung besteht darin, die Funktion choice von numpy zu verwenden.

Sagen Sie, Sie möchten 50 von 100 Einträgen, die Sie verwenden können:

%Vor%

Dies berücksichtigt natürlich nicht Ihre Blockstruktur. Wenn Sie beispielsweise ein Beispiel mit 50 Elementen aus dem Block i haben möchten, können Sie Folgendes tun:

%Vor%     
jpjandrade 28.06.2016 20:24
quelle