Pandas ist eine Python-Bibliothek für die Manipulation und Analyse von Panel-Daten, z. multidimensionale Zeitreihen- und Querschnittsdatensätze, die häufig in Statistiken, experimentellen wissenschaftlichen Ergebnissen, Ökonometrie oder Finanzen zu finden sind. WICHTIG: Wenn Sie eine Frage mit diesem Tag stellen, markieren Sie bitte Ihre Fragen (in dieser Reihenfolge): [tag: python]; [tag: pandas]; [Etikett: Datenrahmen] / [Etikett: Serie]; (optional) [tag: groupby] / [tag: merge] / etc., abhängig von Ihren spezifischen Anforderungen.
Ich habe eine .csv-Datei mit Kontaktinformationen, die ich als Pandas-Datenframe importiere.
%Vor%
Nach dem Importieren der Daten möchte ich Zeilen löschen, in denen ein Feld einen von mehreren Teilstrings in einer Liste enthält. Zum Beispie...
27.07.2015, 21:13
Ich habe den folgenden großen Datenrahmen ( df ), der so aussieht:
%Vor%
Frage: Wie kann die erste Zeile jeder ID am effizientesten gelöscht (oder entfernt) werden? Ich will das:
%Vor%
Ich kann eine Schleife über jedes einzelne ID...
05.07.2015, 00:10
Ich habe ein Problem mit einem Datensatz mit 400.000 Zeilen und 300 Variablen. Ich muss Dummy-Variablen für eine kategorische Variable mit mehr als 3.000 verschiedenen Elementen erhalten. Am Ende möchte ich einen Datensatz mit 3.300 Variablen od...
09.07.2015, 15:27
Versuch, die Designprinzipien einiger Funktionen der Pandas zu verstehen.
Wenn ich einen DataFrame mit 3560 Zeilen und 18 Spalten habe, dann
%Vor%
ist 3560, aber
%Vor%
ist 18.
Vielleicht fühlt sich das für jemanden, der aus R kommt...
18.09.2014, 16:44
Ich möchte eine ganze Zahl zu meinem pandas.Series hinzufügen
Hier ist mein Code:
%Vor%
Wenn ich das ausführe, erhalte ich den folgenden Fehler:
%Vor%
Wie kann ich das beheben?
07.12.2013, 13:36
Ich kann keine Pandas-Funktion finden (die ich vorher gesehen habe), um die NaNs in einem Datenrahmen durch Werte von einem anderen Datenrahmen zu ersetzen (unter der Annahme eines gemeinsamen Index, der spezifiziert werden kann). Irgendwelche H...
30.03.2015, 22:20
Wie kann ich die letzten zwei Ziffern einer DataFrame-Spalte vom Typ int64 entfernen?
Zum Beispiel enthält df['DATE'] :
%Vor%
Was ich möchte ist:
%Vor%
Was ist der einfachste Weg, um dies zu erreichen?
09.10.2015, 09:23