Ich benutze Pymongo, gibt es eine Möglichkeit, wie ich einige Python schreiben kann, um eine Sammlung zu scannen, und ein Gefühl für das Verhältnis von Bytes für Felddeskriptoren vs Bytes für tatsächliche Felddaten zu bekommen?
Ich bin tangential neugierig darauf, was der grundlegende Byte-Overhead pro Dokument ist.
Es gibt keine eingebaute Methode, um das Verhältnis zwischen dem Platz, der für die Schlüssel in BSON-Dokumenten verwendet wird, und dem Abstand, der für die tatsächlichen Feldwerte verwendet wird, zu erhalten. Die collstats und dbstats Befehle können Ihnen nützliche Informationen über die Sammlung und Datenbankgröße geben. Hier ist, wie Sie sie in Pymongo verwenden:
%Vor%Du könntest immer etwas hacken, um eine ziemlich gute Schätzung zu bekommen. Wenn alle Ihre Dokumente in einer Sammlung das gleiche Schema haben, ist so etwas nicht schlecht:
Jetzt d ist der Anteil der gesamten Datengröße der Sammlung, die zum Speichern von Feldnamen verwendet wird.
Tags und Links python python-3.x mongodb pymongo