Wie kann ich Daten aus der mongodb-Sammlung in Pandas 'DataFrame laden?

7

Ich bin neu bei Pandas (naja, zu allem "Programmieren" ...), aber ich wurde ermutigt, es zu versuchen. Ich habe eine mongodb-Datenbank - "test" - mit einer Sammlung namens "Tweets". Ich greife auf die Datenbank in ipython:

%Vor%

Die Dokumentstruktur von Dokumenten in Tweets lautet wie folgt:

%Vor%

Nun, soweit ich es verstehe, heißt die Hauptdatenstruktur der Pandas - eine tabellenartige Tabelle - DataFrame. Wie kann ich die Daten aus meiner "Tweets" Sammlung in Pandas 'DataFrame laden? Und wie kann ich nach einem Filialdokument innerhalb der Datenbank fragen?

    
user2161725 23.07.2013, 08:39
quelle

3 Antworten

16

Verstehen Sie den Cursor, den Sie aus der MongoDB erhalten haben, bevor Sie ihn an DataFrame

übergeben %Vor%     
waitingkuo 23.07.2013, 08:54
quelle
6

Wenn Sie Daten in MongoDb wie folgt haben:

%Vor%

Sie können die Daten direkt in einen Datenrahmen wie folgt einfügen:

%Vor%

Und Sie erhalten diese Ausgabe:

%Vor%

Die Filialdokumente werden jedoch nur als JSON in der Filialdokumentzelle angezeigt. Wenn Sie Objekte so abflachen möchten, dass Filialdokumenteigenschaften als einzelne Zellen angezeigt werden, können Sie json_normalize ohne Parameter.

%Vor%

Dies gibt dem Datenrahmen in diesem Format:

%Vor%     
Mark Unsworth 20.12.2016 10:50
quelle
3

Sie können Ihre MongoDB-Daten mit diesem Code in pandas DataFame laden. Für mich geht das. Ich hoffe auch auf dich.

%Vor%     
saimadhu.polamuri 23.12.2014 09:01
quelle

Tags und Links