was ist der genaue Unterschied zwischen Spark Transformation in DStream und map?

8

Ich versuche, die Transformation in Spark DStream in Spark Streaming zu verstehen.

Ich wusste, dass transform in viel Superlativ im Vergleich zu Karte, aber Kann mir jemand ein Echtzeitbeispiel oder ein klares Beispiel geben, das die Transformation und die Karte unterscheiden kann?

    
Srini 23.08.2015, 14:57
quelle

4 Antworten

12

Die Funktion transform im Spark-Streaming ermöglicht es, alle Transformationen von Apache Spark für die zugrunde liegende RDDs für den Stream zu verwenden. map wird für eine Element-zu-Element-Transformation verwendet und könnte mit transform implementiert werden. Im Wesentlichen funktioniert map an den Elementen DStream und transform ermöglicht es Ihnen, mit RDDs von DStream zu arbeiten. Sie finden Ссылка , um nützlich zu sein.

    
Holden 23.08.2015, 23:54
quelle
1

DStream hat mehrere RDDs, da jedes Batch-Intervall eine andere RDD ist.
Durch die Verwendung von transform () erhalten Sie die Möglichkeit, eine RDD - Operation auf die Anwendung anzuwenden gesamter DStream.

Beispiel aus Spark-Dokumenten: Ссылка

    
uris 01.10.2015 05:43
quelle
1

map ist eine elementare Transformation und transform ist eine RDD-Transformation

Karte

  

map (func): Geben Sie einen neuen DStream zurück, indem Sie jedes Element der Quelle übergeben   DStream durch eine Funktion func.

Hier ist ein Beispiel, das sowohl den Map-Vorgang als auch den Transformationsvorgang auf einem DStream zeigt.

%Vor%

Die Operation map fügt jedem Element in allen RDDs innerhalb von DStream 1 hinzu und gibt eine Ausgabe wie unten gezeigt

%Vor%

transformiere

  

transform (func): Gibt einen neuen DStream zurück, indem eine RDD-to-RDD-Funktion angewendet wird   zu jeder RDD der Quelle DStream. Dies kann verwendet werden, um willkürlich zu machen   RDD-Operationen auf dem DStream.

%Vor%

transform ermöglicht RDD-Operationen wie Join, Union usw. auf den RDDs innerhalb von DStream auszuführen, der hier angegebene Beispielcode erzeugt eine Ausgabe wie folgt

%Vor%

Hier wird die commonRdd , die das Element 0 enthält, eine Vereinigungsoperation mit allen zugrunde liegenden RDDs innerhalb des DStream durchgeführt.

    
remis haroon 27.07.2017 06:10
quelle
1

Mit der Transformationsfunktion in Spark Streaming können Sie beliebige Umwandlungen von zugrunde liegenden RDDs in Stream durchführen. Zum Beispiel können Sie zwei RDDs im Streaming verbinden, indem Sie Transform verwenden, wobei eine RDD eine RDD ist, die aus Textdatei oder parallelisierter Sammlung erstellt wurde und eine andere RDD aus Stream von Textdatei / Socket usw. kommt.

Map funktioniert für jedes RDD-Element in einem bestimmten Stapel und führt nach Anwendung der Funktion, die an Map übergeben wurde, zum RDD.

    
rahul gulati 19.01.2016 06:11
quelle

Tags und Links