Versuche, Kommas und Dollarzeichen mit Pandas in Python zu entfernen

8

Tring, um die Kommas und Dollarzeichen aus den Spalten zu entfernen. Aber wenn ich das tue, druckt der Tisch sie aus und hat sie immer noch da drin. Gibt es eine andere Möglichkeit, die Comman- und Dollar-Zeichen mit einer Pandas-Funktion zu entfernen? Ich war unpraktisch, irgendetwas in den API-Dokumenten zu finden, oder vielleicht habe ich an der falschen Stelle gesucht.

%Vor%     
Mark 22.07.2016, 00:42
quelle

3 Antworten

18

Sie müssen auf das Attribut str pro Ссылка

zugreifen %Vor%     
bernie 22.07.2016, 00:56
quelle
3

Schamlos gestohlen von diese Antwort ... < em> aber , diese Antwort bezieht sich nur auf das Ändern eines Zeichens und vervollständigt nicht die Coolness: Da ein Wörterbuch benötigt wird, können Sie eine beliebige Anzahl von Zeichen gleichzeitig sowie in einer beliebigen Anzahl von Spalten ersetzen / p> %Vor%

@shivsn hat festgestellt, dass Sie regex=True verwenden müssen; Sie wussten bereits von replace (aber es wurde auch nicht angezeigt, dass Sie versuchen, es für mehrere Spalten oder Dollarzeichen und Komma gleichzeitig zu verwenden).

Diese Antwort beschreibt einfach die Details, die ich von anderen an einem Ort für solche wie mich gefunden habe (z. B. noobs to python an pandas ). Ich hoffe, es ist hilfreich.

    
Hendy 26.09.2017 15:49
quelle
0

@ bernies Antwort ist genau richtig für Ihr Problem. Hier ist meine Ansicht über das allgemeine Problem des Ladens numerischer Daten in Pandas.

Die Quelle der Daten sind häufig Berichte, die für den direkten Verbrauch generiert werden. Daher das Vorhandensein von zusätzlichen Formatierungen wie % , Tausendertrennzeichen, Währungssymbolen usw. Alle diese sind nützlich für das Lesen, verursacht aber Probleme für den Standard-Parser. Meine Lösung besteht darin, die Spalte in eine Zeichenfolge zu schreiben, diese Symbole nacheinander zu ersetzen und sie dann in die entsprechenden numerischen Formate zurückzuspielen. Eine Boilerplate-Funktion, die nur [0-9.] behält, ist verlockend, verursacht aber Probleme, wo Tausendertrennzeichen und Dezimalstellen vertauscht werden, auch im Fall von wissenschaftlicher Notation. Hier ist mein Code, den ich in eine Funktion einbinden und nach Bedarf anwenden kann.

%Vor%     
BiGYaN 12.01.2018 16:27
quelle

Tags und Links