Angenommen, Foo
ist eine Fallklasse wie diese:
Verwenden von einfachen RDDs:
%Vor%Daten passen in den Treiberspeicher:
und der gewünschte Bruch ist relativ klein
%Vor%Fraktion, die Sie wollen, ist relativ groß:
%Vor%sonst
%Vor%Verwenden von DataFrame (beachten Sie, dass dies aufgrund des Grenzverhaltens nicht optimal ist).
%Vor%Tags und Links scala apache-spark rdd