hadoop

Hadoop ist ein Apache-Open-Source-Projekt, das Software für zuverlässiges und skalierbares verteiltes Computing bereitstellt. Das Projekt selbst enthält eine Vielzahl anderer ergänzender Ergänzungen.
1
Antwort

warum Hadoop keine Echtzeitplattform ist

Ich habe gerade begonnen, Hadoop zu lernen und bin durch einige Seiten gegangen und habe das oft gefunden "Hadoop ist keine Echtzeitplattform" auch in SO Ich bin damit beschäftigt und ich kann es wirklich nicht verstehen. Kann mir irgend...
28.10.2013, 05:36
2
Antworten

Warum kann der im ausgewählten Teil benannte Alias ​​nicht erkannt werden?

Hier ist das Szenario: Wenn ich hql wie folgt aufruft, sagt es mir, dass es keinen Alias ​​für u1 finden kann. %Vor% Dieses Problem ist das gleiche wie wenn ich versuche, count(*) as cnt zu benutzen. Könnte mir jemand einen Hinweis geben,...
25.09.2014, 00:47
4
Antworten

Hadoop Hive langsame Abfragen

Ich bin neu in Hadoop Hive und entwickle eine Reporting-Lösung. Das Problem ist, dass die Abfrageleistung sehr langsam ist (Hive 0.10, HBase 0.94, Hadoop 1.1.1). Eine der Abfragen ist: %Vor% was ziemlich lange dauert (50s). Ich weiß, ich wei...
03.05.2013, 12:49
1
Antwort

Namespacebild und Bearbeitungsprotokoll

Aus dem Buch " Hadoop The Definitive Guide " wird unter dem Thema Nameodes und Datanodes Folgendes erwähnt:    Der namenode verwaltet den Dateisystem-Namespace. Es behält die   Dateisystembaum und die Metadaten für alle Dateien und Verzeich...
15.11.2014, 06:16
2
Antworten

Sequenzdateien in Hadoop

Wie werden diese Sequenzdateien generiert? Ich habe hier einen Link über die Sequenzdatei gesehen, %Vor% Werden diese mit dem Standard-Java-Serializer geschrieben? und Wie lese ich eine Sequenzdatei?     
23.02.2011, 19:38
2
Antworten

beendet einen Funkensprung in aws

Ich möchte eine Reihe von Funkenschritten auf einem EMR-Funkencluster aufbauen und den aktuellen Schritt beenden, wenn es zu lange dauert. Wenn ich jedoch in den Master-Knoten ssh und die Hadoop-Jobs -list starte, scheint der Master-Knoten zu gl...
26.01.2016, 17:28
2
Antworten

HBase Scan-Leistung

Ich führe einen Bereichsscan durch, der mir 500k Datensätze gibt. Wenn ich scan.setCaching(100000) eingestellt habe, dauerte es weniger als eine Sekunde, aber wenn scan.setCaching(100000) nicht gesetzt ist, dauerte es fast 38 Sekunden....
20.03.2014, 09:41
3
Antworten

Die Hauptklasse com.sun.tools.javac.Main hadoop mapreduce konnte nicht gefunden oder geladen werden

Ich versuche MapReduce zu lernen, aber ich bin jetzt ein wenig verloren. Ссылка Besonders diese Anleitung: %Vor% Wenn ich in meinem Terminal hadoop eintippe, kann ich die "Hilfe" sehen, die Argumente liefert, also glaube ich, dass...
25.03.2015, 16:13