hive, Seitenzahl 5

Hive ist ein Data Warehouse-System für Hadoop, das eine einfache Datenzusammenfassung, Ad-hoc-Abfragen und die Analyse großer Datasets ermöglicht, die in Hadoop-kompatiblen Dateisystemen gespeichert sind. Hive bietet einen Mechanismus zum Projizieren der Struktur auf diese Daten und Abfragen der Daten mithilfe einer SQL-ähnlichen Sprache namens HiveQL.

Antworten

hive - Wie man eine externe Hive-Tabelle zusammen mit Daten löscht

Ich verwende %Vor% Wenn ich die Tabelle mit demselben Schema und demselben Namen neu erzeuge, bekomme ich die alten Daten zurück. Sollte ich das Tabellenverzeichnis aus dem hdfs-Dateisystem entfernen, um die Daten vollständig loszuwerden? ...

24.11.2012, 13:53

Antworten

Hive Sql erhält dynamisch null Spaltenanzahl aus einer Tabelle

Ich benutze Datastax + Spark-Integration und Spark SQL-Spar-Server, die mir eine Hive-SQL-Schnittstelle zur Abfrage der Tabellen in Cassandra gibt. Die Tabellen in meiner Datenbank werden dynamisch erstellt, was ich tun möchte ist, eine Anzah...

16.06.2017, 09:29

Antwort

Explodieren einer Zeile mit XML-Daten in Hive

Wir haben XML-Daten in Hadoop als einzelne String-Spalte mit dem Namen XML geladen. Wir versuchen, auf Datenniveaus zu normalisieren oder es in einzelne Zeilen für die Verarbeitung zu explodieren (Sie wissen, wie eine Tabelle!) Haben explodierte...

13.03.2013, 00:44

Antworten

Herstellen einer Verbindung zwischen R und einer Hive (Hadoop) -Datenbank

Weiß jemand, wie man das erreicht? Ich gehe davon aus, dass RJDBC helfen würde; aber von meinem (wahrscheinlich naiven) Verständnis ist ein bisschen Feinabstimmung notwendig, um einen Hive-Treiber dafür zu schreiben oder anzupassen. Releva...

19.05.2011, 11:24

Antwort

Warum die Hive_Staging-Datei in AWS EMR fehlt

Problem - Ich führe 1 Abfrage in AWS EMR aus. Es schlägt fehl, indem eine Ausnahme ausgelöst wird - %Vor% Ich habe im Folgenden alle diesbezüglichen Informationen zu diesem Problem erwähnt. Bitte überprüfen Sie. Abfrage - %Vor%...

17.09.2016, 12:47

Antwort

Sternschema in der Struktur generieren

Ich komme aus der SQL-Datawarehouse-Welt, wo ich aus einem flachen Feed Dimensions- und Faktentabellen erzeuge. In allgemeinen Data Warehouse-Projekten teilen wir Feeds in Fakten und Dimensionen ein. Ex: Ich bin völlig neu in Hadoop und...

28.03.2017, 12:59

Antwort

Verwendung von Bienentisch über Parkett in Schwein

Ich versuche, eine Hive-Tabelle mit Schema string, string, double in einem Ordner zu erstellen, der zwei Parquet-Dateien enthält. Das erste Parkettdateischema ist string, string, double und das Schema der zweiten Datei ist string, double, s...

20.01.2016, 01:58

Antwort

Der Hive-Identitätswechsel funktioniert nicht mit dem benutzerdefinierten Authentifikatoranbieter

Ich habe einen benutzerdefinierten Authentifikator-Provider entwickelt und alles scheint in Bezug auf die Authentifizierung OK: HiveServer2 startet gut und authentifizierte Verbindungen werden ordnungsgemäß validiert. Sogar einfache Hive-Abfrage...

01.03.2017, 09:45

Antworten

Wie können wir HIVE-Funktionen testen, ohne auf eine Tabelle zu verweisen?

Ich wollte die UDF WeekOfYear verstehen und wie sie die erste Woche startet. Ich musste einen Tisch künstlich treffen und rennen die Abfrage . Ich wollte nicht den Tisch schlagen und die Werte berechnen. Zweitens kann ich den UDF-Quellcode anseh...

08.01.2014, 23:00

Antworten

Wie wird eine programmgesteuerte Verbindung zu einem Hive-Metastore in SparkSQL hergestellt?

Ich benutze HiveContext mit SparkSQL und versuche, mich mit einem entfernten Hive-Metastor zu verbinden. Die einzige Möglichkeit, den Hive-Metastore zu setzen, besteht darin, die hive-site.xml in den Klassenpfad einzubinden (oder in / etc zu kop...

13.08.2015, 06:04