Angenommen, ich habe einen Datenrahmen mit 100.000 Einträgen und möchte ihn in 100 Abschnitte von 1000 Einträgen aufteilen.
Wie nehme ich eine zufällige Stichprobe von etwa Größe 50 von nur einem der 100 Abschnitte. Der Datensatz ist bereits so geordnet, dass die ersten 1000 Ergebnisse der erste Abschnitt, der nächste Abschnitt der nächste usw. sind.
vielen Dank
Sie können die * Auf einem der Abschnitt DataFrames. Hinweis: Wenn Sie eine größere Stichprobengröße als die Größe des Datenrahmens haben, wird dies zu einem Fehler führen, es sei denn, Sie probieren mit Ersatz. sample
-Methode *:
Eine Lösung besteht darin, die Funktion choice
von numpy zu verwenden.
Sagen Sie, Sie möchten 50 von 100 Einträgen, die Sie verwenden können:
%Vor% Dies berücksichtigt natürlich nicht Ihre Blockstruktur. Wenn Sie beispielsweise ein Beispiel mit 50 Elementen aus dem Block i
haben möchten, können Sie Folgendes tun:
Tags und Links python pandas sample random-sample