Hadoop, Hive, Schwein, HBase, Cassandra - wann soll was verwendet werden? [geschlossen]

8

Zunächst bin ich relativ neu in Big Data und der Hadoop-Welt und habe gerade angefangen, ein wenig mit der Hortonworks Sandbox (Pig and Hive) zu experimentieren. Ich habe mich gefragt, in welchen Fällen ich die oben genannten Werkzeuge von Hadoop, Hive, Pig, HBase und Cassandra verwenden könnte?

In meiner Sandbox-Umgebung mit einer Datei von nur 9 MB hatten Hive und Pig Antwortzeiten von Sekunden bis Minuten. Dies ist offensichtlich nicht in einigen Situationen zum Beispiel Web-Anwendungen (es sei denn, es ist etwas anderes wie meine virtuelle Maschine Setup).

Meine Vermutungen über die richtige Verwendung sind:

  • Hadoop: Nur die technologische Basis für den Rest, nur sehr wenige Anwendungsfälle, in denen es direkt verwendet würde
  • Hive oder Pig: Für analytische Prozesse, die einmal pro Stunde oder Tag laufen
  • HBase oder Cassandra: für Echtzeitanwendungen (z. B. Webanwendungen), bei denen Reaktionszeiten von 100 ms oder weniger erforderlich sind

Außerdem, wann HBase im Gegensatz zu wann Cassandra zu verwenden?

Danke!

    
Daniel 29.01.2014, 18:02
quelle

1 Antwort

7

Ihre Vermutungen sind etwas genau.

Mit Hadoop, ich denke, Sie beziehen sich auf MapReduce? Hadoop als solches ist ein Ökosystem, das aus vielen Komponenten besteht (einschließlich MapReduce, HDFS, Pig und Hive).

MapReduce ist gut, wenn Sie die Logik zum Verarbeiten von Daten auf der Methodenebene Map () und Reduce () schreiben müssen. In meinen Arbeiten finde ich MapReduce sehr nützlich, wenn es sich um unstrukturierte Daten handelt. muss gereinigt werden.

Hive, Pig: Sie eignen sich für Stapelprozesse, die regelmäßig ausgeführt werden (etwa in Stunden oder Tagen).

HBase & amp; Cassandra: Unterstützt Anrufe mit niedriger Latenz. Sie können also für Echtzeitanwendungen verwendet werden, bei denen die Reaktionszeit entscheidend ist. Werfen Sie einen Blick auf diese Diskussion , um eine bessere Vorstellung von HBase vs Cassandra.

    
Chaos 29.01.2014, 19:44
quelle

Tags und Links