Angenommen, ich habe einen pandas Datenrahmen surveyData:
Ich möchte die Daten in jeder Spalte normalisieren, indem Sie Folgendes ausführen:
%Vor%Dies würde funktionieren, wenn meine Datentabelle nur die Spalten enthält, die ich normalisieren möchte. Ich habe jedoch einige Spalten mit String-Daten wie:
%Vor%Ich möchte nur die Spalten "Age", "Income" und "Height" normalisieren, aber meine obige Methode funktioniert nicht, weil die String-Daten in den Spalten name state und gender angezeigt werden.
Sie können Operationen für eine Untergruppe von Zeilen oder Spalten in Pandas auf verschiedene Arten ausführen. Ein nützlicher Weg ist die Indizierung:
%Vor%Damit wird es nur auf die gewünschten Spalten angewendet und das Ergebnis diesen Spalten zugeordnet. Alternativ können Sie sie auf neue, normalisierte Spalten setzen und die Originale behalten, wenn Sie möchten.
.....
Einfacher Weg und viel effizienter:
Berechnen Sie den Mittelwert:
dropna()
vermeiden Sie fehlende Daten.
dieser Weg wird funktionieren ...