Weiß jemand, wie man das erreicht?
Ich gehe davon aus, dass RJDBC helfen würde; aber von meinem (wahrscheinlich naiven) Verständnis ist ein bisschen Feinabstimmung notwendig, um einen Hive-Treiber dafür zu schreiben oder anzupassen.
Relevante Dokumentation:
Jede Hilfe oder Anregung ist willkommen! Wenn das vorher niemand gemacht hat, würde ich gerne ein bisschen auf eine Lösung hinarbeiten, aber ich kenne fast kein Java.
R kann über RJDBC mit Hive verbunden werden. Sie benötigen jedoch einen Hive-Server und Treiber.
Hive-Server:
%Vor%Treiber: Laden Sie Toad für Cloud DBs, Ссылка herunter, und verwenden Sie dort enthaltene Treiber (entpacken Sie die Jars und suche nach den Dateien unten).
Unten ist eine R-Funktion, die Sie definieren können, um eine Verbindung zu einem Hive-Server herzustellen.
%Vor%Ich habe diese nicht getestet, aber versuche das RHIPE und hive Pakete.
Siehe diese Quora-Frage (insbesondere Jeff Hammerbachers Antwort) für eine Diskussion über andere Optionen.