Ich bin neu bei Pandas (naja, zu allem "Programmieren" ...), aber ich wurde ermutigt, es zu versuchen. Ich habe eine mongodb-Datenbank - "test" - mit einer Sammlung namens "Tweets". Ich greife auf die Datenbank in ipython:
%Vor%Die Dokumentstruktur von Dokumenten in Tweets lautet wie folgt:
%Vor%Nun, soweit ich es verstehe, heißt die Hauptdatenstruktur der Pandas - eine tabellenartige Tabelle - DataFrame. Wie kann ich die Daten aus meiner "Tweets" Sammlung in Pandas 'DataFrame laden? Und wie kann ich nach einem Filialdokument innerhalb der Datenbank fragen?
Verstehen Sie den Cursor, den Sie aus der MongoDB erhalten haben, bevor Sie ihn an DataFrame
übergeben %Vor%Wenn Sie Daten in MongoDb wie folgt haben:
%Vor%Sie können die Daten direkt in einen Datenrahmen wie folgt einfügen:
%Vor%Und Sie erhalten diese Ausgabe:
%Vor%Die Filialdokumente werden jedoch nur als JSON in der Filialdokumentzelle angezeigt. Wenn Sie Objekte so abflachen möchten, dass Filialdokumenteigenschaften als einzelne Zellen angezeigt werden, können Sie json_normalize ohne Parameter.
%Vor%Dies gibt dem Datenrahmen in diesem Format:
%Vor%Sie können Ihre MongoDB-Daten mit diesem Code in pandas DataFame laden. Für mich geht das. Ich hoffe auch auf dich.
%Vor%