Sequenzdateien werden von MapReduce-Tasks generiert und können als gemeinsames Format zum Übertragen von Daten zwischen MapReduce-Jobs verwendet werden.
Sie können sie folgendermaßen lesen:
%Vor%Sie können Sequenzdateien auch selbst erstellen, indem Sie SequenceFile.Writer verwenden.
Die im Beispiel verwendeten Klassen sind die folgenden:
%Vor% Und sind in der hadoop-core
maven-Abhängigkeit enthalten:
Dank Lev Khomichs Antwort wurde mein Problem gelöst.
Die Lösung ist jedoch seit einiger Zeit veraltet, und die neue API bietet mehr Funktionen und ist außerdem einfach zu verwenden.
Sehen Sie sich den Quellcode von hadoop.io.SequenceFile an und klicken Sie auf hier :
%Vor%Zusätzliche Informationen, hier ist die Beispielausgabe, die gegen die Datendatei läuft, die von Nutch / Injector generiert wurde:
%Vor%Danke!