Wie prüfe ich den Inhalt einer Parquet-Datei über die Befehlszeile?
Die einzige Option, die ich jetzt sehe, ist
%Vor%Ich möchte
local-file
und json
anstelle des typlosen Textes an, den parquet-tools
druckt. Gibt es einen einfachen Weg?
Sie können parquet-tools
mit dem Befehl cat
und der Option --json
verwenden, um die Dateien ohne lokale Kopie und im JSON-Format anzuzeigen.
Hier ist ein Beispiel:
%Vor%Dies druckt die Daten im JSON-Format aus:
%Vor%Haftungsausschluss: Dies wurde in Cloudera CDH 5.12.0 getestet.
Standardmäßig sucht parquet-tools im Allgemeinen nach dem lokalen Dateiverzeichnis. Um es auf hdfs zu verweisen, müssen wir hdfs: // am Anfang des Dateipfads hinzufügen. In Ihrem Fall können Sie so etwas tun
%Vor%Ich hatte das gleiche Problem und es hat gut für mich funktioniert. Es ist nicht notwendig, die Datei zuerst lokal herunterzuladen.
Tags und Links parquet