Herstellen einer Verbindung zwischen R und einer Hive (Hadoop) -Datenbank

8

Weiß jemand, wie man das erreicht?

Ich gehe davon aus, dass RJDBC helfen würde; aber von meinem (wahrscheinlich naiven) Verständnis ist ein bisschen Feinabstimmung notwendig, um einen Hive-Treiber dafür zu schreiben oder anzupassen.

Relevante Dokumentation:

Jede Hilfe oder Anregung ist willkommen! Wenn das vorher niemand gemacht hat, würde ich gerne ein bisschen auf eine Lösung hinarbeiten, aber ich kenne fast kein Java.

    
crayola 19.05.2011, 11:24
quelle

2 Antworten

2

R kann über RJDBC mit Hive verbunden werden. Sie benötigen jedoch einen Hive-Server und Treiber.

Hive-Server:

%Vor%

Treiber: Laden Sie Toad für Cloud DBs, Ссылка herunter, und verwenden Sie dort enthaltene Treiber (entpacken Sie die Jars und suche nach den Dateien unten).

Unten ist eine R-Funktion, die Sie definieren können, um eine Verbindung zu einem Hive-Server herzustellen.

%Vor%     
Yakov Keselman 25.06.2013 21:40
quelle
1

Ich habe diese nicht getestet, aber versuche das RHIPE und hive Pakete.

Siehe diese Quora-Frage (insbesondere Jeff Hammerbachers Antwort) für eine Diskussion über andere Optionen.

    
Richie Cotton 19.05.2011 12:19
quelle

Tags und Links