hive

Hive ist ein Data Warehouse-System für Hadoop, das eine einfache Datenzusammenfassung, Ad-hoc-Abfragen und die Analyse großer Datasets ermöglicht, die in Hadoop-kompatiblen Dateisystemen gespeichert sind. Hive bietet einen Mechanismus zum Projizieren der Struktur auf diese Daten und Abfragen der Daten mithilfe einer SQL-ähnlichen Sprache namens HiveQL.
1
Antwort

Python-Client-Unterstützung für die Ausführung von Hive auf Amazon EMR

Ich habe festgestellt, dass weder mrjob noch boto eine Python-Schnittstelle unterstützen, um Hive-Jobs auf Amazon Elastic MapReduce (EMR) zu senden und auszuführen. Gibt es noch andere Python-Client-Bibliotheken, die die Ausführung von Hive auf...
23.05.2011, 22:36
3
Antworten

Hive / HBase-Integration - Die Zookeeper-Sitzung wird sofort geschlossen

Wir haben einen 8-Knoten-Cluster mit CDH3u2, der mit Cloudera Manager konfiguriert wurde. Wir haben einen dedizierten Hauptknoten, der unsere einzige Instanz des Tierpflegers ausführt. Wenn ich die Hive konfiguriere, um den lokalen Hadoop auszuf...
03.02.2012, 21:33
3
Antworten

SQL-Abfrage Häufigkeit Verteilungsmatrix für Produkt

Ich möchte eine Häufigkeitsverteilungsmatrix erstellen %Vor% Kann jemand bitte mir für eine Lösung zu diesem helfen     
12.03.2017, 15:08
1
Antwort

Gibt es in Hive die maximale Größe des String-Datentyps?

Google eine Tonne, aber habe es nirgendwo gefunden. Oder bedeutet das, dass Hive einen beliebig großen String-Datentyp unterstützen kann, solange Cluster zulässig ist? Wenn ja, wo finde ich die größte Größe des String-Datentyps, den mein Cluster...
27.01.2016, 07:14
1
Antwort

SparkSQL, Thrift Server und Tableau

Ich frage mich, ob es einen Weg gibt, der die Tabelle sparkSQL in sqlContext direkt für andere Prozesse sichtbar macht, zum Beispiel für Tableau. Ich habe etwas über Spar-Server recherchiert, aber ich habe keine spezifische Erklärung da...
23.07.2015, 20:25
1
Antwort

Hadoop, Hive, Schwein, HBase, Cassandra - wann soll was verwendet werden? [geschlossen]

Zunächst bin ich relativ neu in Big Data und der Hadoop-Welt und habe gerade angefangen, ein wenig mit der Hortonworks Sandbox (Pig and Hive) zu experimentieren. Ich habe mich gefragt, in welchen Fällen ich die oben genannten Werkzeuge von Hadoo...
29.01.2014, 18:02
2
Antworten

Hive fügt Werte in eine Array-Spalte mit komplexem Typ ein

Ich kann keine Daten an Tabellen anhängen, die eine Array-Spalte enthalten, indem Sie in Anweisungen einfügen; der Datentyp ist Array & lt; varchar (200) & gt; Mit jodbc kann ich keine Werte in eine Array-Spalte einfügen, z. B .: %Vor% er...
25.05.2015, 22:04
1
Antwort

Kann die dynamische Partitionierung für einen großen Datensatz in Hive nicht anwenden

Ich habe eine Tabelle test_details mit etwa 4 Millionen Datensätzen. Unter Verwendung der Daten in dieser Tabelle muss ich eine neue partitionierte Tabelle test_details_par mit Datensätzen erstellen, die auf visit_date partitioniert sin...
19.02.2014, 09:53
1
Antwort

Hive QL - Begrenzt die Anzahl der Zeilen pro Element

Wenn ich mehrere Elemente in einer where-Klausel aufgelistet habe Wie würde man die Ergebnisse für jedes Element in der Liste auf N beschränken? EX: %Vor%     
31.07.2012, 23:06
3
Antworten

Benutzer zum Ausführen des HIVE-Jobs aufgefordert?

Ich führe einen HIVE-Job mit meiner erweiterten Klasse UDF aus. Ich möchte den Namen des Benutzers erhalten, der meinen Job übermittelt, also verwende ich %Vor% um den Benutzernamen zu erhalten, aber das Problem ist, dass der Benutzer ma...
10.12.2013, 11:15