Wie lese ich sequentielle Hadoop-Dateien?

8

Ich habe eine sequentielle Datei, die die Ausgabe des hadoop map-reduce-Jobs ist. In dieser Datei werden Daten in Schlüsselwertpaare geschrieben, und der Wert selbst ist eine Map. Ich möchte den Wert als ein MAP-Objekt lesen, damit ich es weiter verarbeiten kann.

%Vor%

Ausgabe des Programms: Schlüssel ist: [dies ist der Schlüssel] Wert ist: {abc = 839177, xyz = 548498, lmn = 2, pqr = 1}

Hier bekomme ich Wert als String, aber ich will es als ein Objekt der Karte.

    
samarth 25.11.2011, 05:54
quelle

1 Antwort

6

Überprüfen Sie die API-Dokumentation für SequenceFile # next (Beschreibbar, Beschreibbar)

%Vor%

sollte durch

ersetzt werden %Vor%

Verwenden Sie SequenceFile.Reader # getValueClassName , um den Werttyp in der SequenceFile abzurufen. SequenceFile enthält die Schlüssel- / Werttypen im Dateiheader.

    
Praveen Sripati 25.11.2011, 09:30
quelle