Cascading ist eine Abfrage-API, ein Abfrageplaner und ein Process Scheduler, die zum Definieren und Ausführen von komplexen, skalenfreien und fehlertoleranten Datenverarbeitungsworkflows in einem Hadoop-Cluster verwendet werden.
Ich führe einen Hadoop-Job für viele Eingabedateien durch.
Wenn jedoch eine der Dateien beschädigt ist, schlägt der gesamte Job fehl.
Wie kann ich den Job machen, um die beschädigte Datei zu ignorieren?
schreiben Sie vielleicht für mich ein Z...
17.02.2013, 10:41