hive

Hive ist ein Data Warehouse-System für Hadoop, das eine einfache Datenzusammenfassung, Ad-hoc-Abfragen und die Analyse großer Datasets ermöglicht, die in Hadoop-kompatiblen Dateisystemen gespeichert sind. Hive bietet einen Mechanismus zum Projizieren der Struktur auf diese Daten und Abfragen der Daten mithilfe einer SQL-ähnlichen Sprache namens HiveQL.
1
Antwort

HIVE prüft auf Daten aus Tabelle 1, die in Tabelle 2 nicht vorhanden sind

Ich suche eine HIVE-SQL-Abfrage, um alle Werte aus Tabelle 1 zu finden, die NICHT in Tabelle 2 vorhanden sind. Ich verstehe, dass ich einen Join verwenden muss, aber ich kann nicht herausfinden, wie man ihn für diese Situation implementiert. .....
12.03.2013, 11:02
3
Antworten

Hive lädt in partitionierte Tabelle

Ich habe eine Protokolldatei in HDFS, Werte werden durch Komma getrennt. Zum Beispiel: 2012-10-11 12:00,opened_browser,userid111,deviceid222 Nun möchte ich diese Datei in die Hive-Tabelle laden, die Spalten "timestamp", "action" und par...
30.10.2012, 21:58
1
Antwort

Hadoop: Das FSCK-Ergebnis zeigt fehlende Replikate an

Könnte mir jemand sagen, wie man fehlende Repliken repariert? ================================================== ============================= Gesamtgröße: 3447348383 B Gesamtdurchlauf: 120 Gesamtanzahl der Dateien: 98 Gesamtblöck...
18.04.2013, 06:36
5
Antworten

Hive: Summe über eine angegebene Gruppe (HiveQL)

Ich habe eine Tabelle: %Vor% Ich möchte die Summe aller Produkte für jede Gruppe von "Schlüssel" finden und an jede Zeile anhängen. Zum Beispiel für Schlüssel = 1, finde die Summe der Kosten aller Produkte (20 + 10 + 5 = 35) und hänge dann d...
01.08.2014, 14:03
4
Antworten

Wie kann shoop verwendet werden, um die standardmäßige Hive-limitierte Ausgabe zu exportieren?

Ich habe eine Bienenstockabfrage: %Vor% Dann versuche ich die Daten mit sqoop zu exportieren %Vor% Aber das scheint die Felder nicht nach Trennzeichen zu analysieren Was vermisse ich? Ich denke, der - Eingabefelder - terminiert durch 0x...
24.09.2013, 10:05
1
Antwort

Gruppieren von Hive-Zeilen in einem Array dieser Zeilen

Ich habe eine Tabelle wie die folgende: %Vor% Und ich möchte alle Aliase eines Benutzers in einem Array in einer neuen Tabelle gruppieren, die wie folgt aussehen würde: %Vor% Ich kann nicht herausfinden, wie man das mit HiveQL macht. Mus...
30.05.2013, 12:49
3
Antworten

UDF kann nicht auf dem Hive-Server ausgeführt werden

Ich bin im Spar-Server-Modus. Ich habe eine UDF in einer JAR-Datei, die ich benutze, indem ich benutze %Vor% Beim Ausführen des Befehls create temporary function erhalte ich jedoch einen Fehler    Abfrage hat Code ungleich Null zurückgege...
23.02.2012, 05:21
1
Antwort

java.sql.SQLException: org.apache.thrift.transport.TTransportException in der Struktur?

Ich versuche, Tabelle in Bienenstock mit Java zu erstellen. Ich habe gefunden java.sql.SQLException: org.apache.thrift.transport.TTransportException während der Ausführung meines Codes. Hier ist mein Code %Vor% Warum wird diese A...
31.05.2012, 06:35
4
Antworten

Ausführungsfehler, Rückgabecode 1 aus org.apache.hadoop.hive.ql.exec.MapRedTask

Ich habe ein Problem bei der Ausführung von CONDITIONAL QUERIES in HiveQL. Die grundlegende select * from tablename -Anweisung funktioniert gut.     Der Fehler ist: %Vor% Ich habe es sowohl mit Eclipse IDE als auch mit Hive Shell versucht...
18.05.2012, 14:10
4
Antworten

Automatisiertes Testen in Apache Hive

Ich beginne ein Projekt mit Apache Hadoop / Hive, das eine Sammlung von Hive-Abfrageskripten beinhalten wird, um Datenfeeds für verschiedene Downstream-Anwendungen zu erzeugen. Diese Skripte scheinen ideale Kandidaten für einige Komponententests...
23.02.2011, 15:04