RDD in iterable konvertieren: PySpark?

Question

RDD in iterable konvertieren: PySpark?

8

Ich habe eine RDD, die ich erstelle, indem ich eine Textdatei lade und vorbearbeite. Ich möchte es nicht sammeln und auf der Festplatte oder dem Speicher (ganze Daten) speichern, sondern es lieber an eine andere Funktion in Python weitergeben, die Daten nacheinander in Form von iterierbaren Daten konsumiert.

Wie ist das möglich?

%Vor%

python apache-spark pyspark rdd

mousecoder 24.09.2015, 22:07

quelle

1 Antwort

Tags und Links python apache-spark pyspark rdd

Django: Verwenden von Annotate, Count und Distinct in einem Queryset Laravel-Schnittstellen

score 12 · Accepted Answer

12

Ich glaube, was Sie wollen, ist toLocalIterator() :

danf1024 24.09.2015, 22:18

quelle