Sie können dies leicht mit Apache Spark und Python erreichen. Lade zuerst die Funke-Distribution von Ссылка herunter und installiere avro
package für Python mit pip
. Dann starte pyspark mit avro package:
und verwenden Sie den folgenden Code (vorausgesetzt, die input.json
-Dateien enthalten ein oder mehrere json-Dokumente, jeweils in einer separaten Zeile):
Zum Beispiel: für eine Eingabedatei mit Inhalt:
%Vor%Das Skript führt zu:
%Vor%