hadoop

Hadoop ist ein Apache-Open-Source-Projekt, das Software für zuverlässiges und skalierbares verteiltes Computing bereitstellt. Das Projekt selbst enthält eine Vielzahl anderer ergänzender Ergänzungen.
2
Antworten

Hadoop: Auftrag wird in kleineren Datenmengen ausgeführt, schlägt jedoch mit großen Datenmengen fehl

Ich habe eine folgende Situation Ich habe 3 Maschinencluster mit folgender Konfiguration. Master %Vor% Slave 01 %Vor% Slave 02 %Vor% hadoop / conf / core-site.xml %Vor% hadoop / conf / mapred-site.xml %Vor%...
22.07.2012, 16:40
3
Antworten

So konvertieren Sie ein Hadoop-Pfadobjekt in ein Java-Dateiobjekt

Gibt es eine Möglichkeit, ein gültiges und vorhandenes Hadoop-Pfadobjekt in ein nützliches Java-Dateiobjekt zu ändern. Gibt es eine gute Möglichkeit, dies zu tun oder muss ich knüppeln, um Code in die Einreichung zu schreiben? Die offensichtlich...
09.08.2010, 21:20
3
Antworten

Hauptklasse konnte nicht gefunden oder geladen werden, wenn versucht wird, nomenode zu formatieren; Hadoop-Installation unter MAC OS X 10.9.2

Ich versuche, ein Entwicklungs-Einzelknoten-Cluster-Setup auf meinem MAC OS X 10.9.2 mit hadoop zu bekommen. Ich habe verschiedene Online-Tutorials ausprobiert, wobei das neueste dieses ist >. Um zusammenzufassen, was ich getan habe: %Vor%...
11.04.2014, 16:28
2
Antworten

Wie sortiere ich die Wortzahl in hadoop nach Wert? [Duplikat]

hi Ich wollte lernen, wie man die Wortzählung nach Wert in hadoop sortiert. Ich kenne Hadoop-Takes von Sortierschlüsseln, aber nicht nach Werten. ich weiß, um die Werte zu sortieren, müssen wir einen Partitionierer, einen Gruppierungskompar...
23.08.2013, 13:16
2
Antworten

Fehler beim Starten von hadoop Job Tracker

Ich habe versucht, ein einfaches Programm in hadoop mit Windows-Cygwin zu starten. Ich kann den namenode starten. Der Start des Jobtrackers schlägt jedoch mit Ausnahme fehl: %Vor% Ich habe alle möglichen Methoden versucht, um dies zu b...
08.04.2012, 00:59
1
Antwort

Verschieben von Daten in hdfs mit dem copyFromLocal-Schalter

Ich weiß nicht, was hier vor sich geht, aber ich versuche, eine einfache Datei von einem Verzeichnis in meinem lokalen Dateisystem in das für hdfs angegebene Verzeichnis zu kopieren. In meiner hdfs-site.xml habe ich angegeben, dass das Verzei...
05.02.2013, 09:57
4
Antworten

Ermitteln von verbundenen Komponenten mithilfe von Hadoop / MapReduce

Ich muss verbundene Komponenten für einen großen Datensatz finden. (Graph ist ungerichtet) Eine offensichtliche Wahl ist MapReduce. Aber ich bin ein Neuling für MapReduce und habe keine Zeit, es aufzunehmen und selbst zu programmieren. Ich...
20.05.2012, 21:30
1
Antwort

Hadoop 2.0-Name Knoten, sekundärer Knoten und Prüfpunktknoten für hohe Verfügbarkeit

Nach dem Lesen der Apache Hadoop-Dokumentation gibt es eine kleine Verwirrung beim Verständnis der Verantwortlichkeiten des sekundären Knotens & amp; Kontrollpunkt Knoten Ich bin klar in Nameode Rolle und Verantwortlichkeiten:    Der...
17.08.2015, 13:12
1
Antwort

Wie übermittele ich einen Spark-Job auf einem Remote-Master-Knoten im Garn-Client-Modus?

Ich muss Spark Apps / Jobs auf einen Remote-Funke-Cluster einreichen. Ich habe momentan auf meinem Rechner und der IP-Adresse des Master-Knotens als Garn-Client gezündet. Übrigens ist meine Maschine nicht im Cluster. Ich reiche meinen Job mit di...
06.06.2016, 01:25
1
Antwort

Hadoop: Das FSCK-Ergebnis zeigt fehlende Replikate an

Könnte mir jemand sagen, wie man fehlende Repliken repariert? ================================================== ============================= Gesamtgröße: 3447348383 B Gesamtdurchlauf: 120 Gesamtanzahl der Dateien: 98 Gesamtblöck...
18.04.2013, 06:36