Die derzeit akzeptierte Antwort, die filter
und nonEmpty
verwendet, verursacht einige Leistungseinbußen, weil nonEmpty
keine Methode für String
ist, sondern stattdessen durch implizite Konvertierung hinzugefügt wird. Wenn Wertobjekte verwendet werden, erwarte ich, dass der Unterschied fast nicht wahrnehmbar ist, aber bei Versionen von Scala, wo dies nicht der Fall ist, ist es ein wesentlicher Erfolg.
Stattdessen könnte man das verwenden, was garantiert schneller ist:
%Vor%val tokenizedLines = (linien.map (Tokenizer.tokenize)). filter (_. nonEmpty)
Tags und Links scala apache-spark