Ich versuche, das folgende Spark-Beispiel unter Hadoop 2.6 auszuführen, aber ich erhalte den folgenden Fehler:
INFO RMProxy: Verbindung zum ResourceManager unter /0.0.0.0:8032 und der Client tritt in eine Schleife ein, um eine Verbindung herzustellen. Ich betreibe eine Gruppe von zwei Maschinen, einen Master und einen Slave.
%Vor%Das ist der Fehler, den ich bekomme:
%Vor%jps
hususer @ master: / usr / local / spark $ jps
%Vor%Mein / etc / host /
%Vor%Die folgenden Zeilen sind für IPv6-fähige Hosts wünschenswert.
%Vor%Ich war auch auf das gleiche Problem gestoßen, wo ich den Funkenjob nicht mit einer Funkenabgabe vorlegen konnte.
Das Problem war auf den fehlenden HADOOP_CONF_DIR-Pfad zurückzuführen, während der Spark-Job gestartet wurde. Wenn Sie also den Job übergeben, legen Sie HADOOP_CONF_DIR auf das entsprechende HADOOP CONF-Verzeichnis fest. Wie export HADOOP_CONF_DIR = / etc / hadoop / conf
Wie Sie hier sehen können yarn.resourcemanager.address
wird basierend auf yarn.resourcemanager.hostname
berechnet, dessen Standardwert auf 0.0.0.0 festgelegt ist. Also solltest du es richtig konfigurieren.
Bearbeiten Sie von der Basis der Hadoop-Installation aus die etc/hadoop/yarn-site.xml
-Datei und fügen Sie diese Eigenschaft hinzu.
Wenn Sie start-yarn.sh
erneut ausführen, werden Ihre neuen Einstellungen wirksam.
Ich habe das gleiche Problem. Meine Ursache ist, dass die Zeiten zwischen Maschinen nicht übereinstimmen, da mein Ressourcenmanager nicht auf dem Mastercomputer ist. Ein Unterschied von nur einer Sekunde kann ein Problem mit der Garnverbindung verursachen. Ein Unterschied von einigen Sekunden kann dazu führen, dass der Knoten und der Datumsknoten nicht mehr gestartet werden können. Verwenden Sie ntpd, um die Zeitsynchronisierung zu konfigurieren, um sicherzustellen, dass die Zeiten genau übereinstimmen.
Tags und Links java hadoop apache-spark resourcemanager