hive

Hive ist ein Data Warehouse-System für Hadoop, das eine einfache Datenzusammenfassung, Ad-hoc-Abfragen und die Analyse großer Datasets ermöglicht, die in Hadoop-kompatiblen Dateisystemen gespeichert sind. Hive bietet einen Mechanismus zum Projizieren der Struktur auf diese Daten und Abfragen der Daten mithilfe einer SQL-ähnlichen Sprache namens HiveQL.
2
Antworten

Wählen Sie die obersten 2 Zeilen in Hive aus

Ich bin ein Noobie hier. Ich versuche, Top 2 Tabellen aus meiner Mitarbeiterliste basierend auf Gehalt in Bienenstock (Version 0.11) abrufen. Da es die TOP-Funktion nicht unterstützt, gibt es Alternativen? Oder haben wir eine UDF definiert?    ...
25.05.2015, 15:41
4
Antworten

Hive - Wie sieht man die in metastore erstellte Tabelle?

Hier ist unser Setup - Wir haben Hive, die MySQL auf einer anderen Maschine als Metastore verwendet. Ich kann die Hive-Kommandozeilen-Shell starten und eine Tabelle erstellen und sie beschreiben. Aber wenn ich mich an der anderen Maschine anmeld...
24.05.2013, 15:25
2
Antworten

Warum kann der im ausgewählten Teil benannte Alias ​​nicht erkannt werden?

Hier ist das Szenario: Wenn ich hql wie folgt aufruft, sagt es mir, dass es keinen Alias ​​für u1 finden kann. %Vor% Dieses Problem ist das gleiche wie wenn ich versuche, count(*) as cnt zu benutzen. Könnte mir jemand einen Hinweis geben,...
25.09.2014, 00:47
4
Antworten

Hadoop Hive langsame Abfragen

Ich bin neu in Hadoop Hive und entwickle eine Reporting-Lösung. Das Problem ist, dass die Abfrageleistung sehr langsam ist (Hive 0.10, HBase 0.94, Hadoop 1.1.1). Eine der Abfragen ist: %Vor% was ziemlich lange dauert (50s). Ich weiß, ich wei...
03.05.2013, 12:49
4
Antworten

Verwenden von FileFormat v Serde zum Lesen benutzerdefinierter Textdateien

Hadoop / Hive Neuling hier. Ich versuche, Daten in einem benutzerdefinierten textbasierten Format mit Hive zu verwenden. Mein Verständnis ist, dass Sie entweder eine benutzerdefinierte FileFormat oder eine benutzerdefinierte SerDe Klasse s...
12.10.2011, 01:01
1
Antwort

Welcher Hash-Algorithmus wird für die integrierte HASH () - Funktion von Hive verwendet?

Welche Art von Hash-Algorithmus wird in der integrierten HASH () - Funktion verwendet? Ich suche idealerweise nach einem SHA512 / SHA256-Hash, ähnlich dem, was die SHA () - Funktion innerhalb der Linkedin-Datafu-UDFs für Pig bietet.     
17.01.2014, 02:09