cloudera-cdh

Fragen speziell zu Clouderas Distribution von Apache Hadoop (CDH). Bitte schauen Sie auf https://community.cloudera.com, bevor Sie Fragen stellen.
4
Antworten

PySpark verteilte Verarbeitung auf einem YARN-Cluster

Ich habe Spark auf einem Cloudera CDH5.3-Cluster ausgeführt, wobei YARN als Ressourcenmanager verwendet wird. Ich entwickle Spark Apps in Python (PySpark). Ich kann Jobs einreichen und sie werden erfolgreich ausgeführt, scheinen jedoch nie au...
30.01.2015, 05:06
1
Antwort

Impala-Cluster von tragbaren Binärdateien ausführen

Ich evaluiere mehrere Big-Data-Tools. Einer von ihnen ist natürlich Impala. Ich möchte Impala Cluster starten, indem ich Prozesse auf den Clusterknoten manuell starte. Wie ich gerade für Spark, H2O, Presto und Dask mache, möchte ich Binärdateie...
22.08.2016, 20:03
1
Antwort

Kann Hadoop nicht mit Cloudera Manager installieren

Ich versuche, den Hadoop-Cluster in einer einzigen VM einzurichten (der Einfachheit halber) mit cloudera Manager 5.9. Die folgenden sind die Details meiner Umgebung: %Vor% Ich habe den Cloudera Manager installiert und gemäß den Anweisungen v...
17.12.2016, 17:23
1
Antwort

URI konnte nicht mit dem Schlüssel dfs.encryption.key.provider.uri gefunden werden, um einen Schlüsselprovider in HDFS-Verschlüsselung für CDH 5.4 zu erstellen

CDH-Version: CDH5.4.5 Problem: Wenn die HDFS-Verschlüsselung mithilfe von in Hadoop CDH 5.4 verfügbarem KMS aktiviert ist, wird beim Ablegen der Datei in die Verschlüsselungszone ein Fehler angezeigt. Schritte: Schritte zur Verschlüssel...
09.09.2015, 10:07