cascading

Cascading ist eine Abfrage-API, ein Abfrageplaner und ein Process Scheduler, die zum Definieren und Ausführen von komplexen, skalenfreien und fehlertoleranten Datenverarbeitungsworkflows in einem Hadoop-Cluster verwendet werden.
3
Antworten

wie verhindert werden kann, dass der Hadoop-Job in einer beschädigten Eingabedatei fehlschlägt

Ich führe einen Hadoop-Job für viele Eingabedateien durch. Wenn jedoch eine der Dateien beschädigt ist, schlägt der gesamte Job fehl. Wie kann ich den Job machen, um die beschädigte Datei zu ignorieren? schreiben Sie vielleicht für mich ein Z...
17.02.2013, 10:41