Ich habe eine org.apache.spark.sql.DataFrame mit mehreren Spalten. Ich möchte 1 Spalte (lat_long_dist) skalieren mit MinMax-Normalisierung oder einer beliebigen Technik, um die Daten zwischen -1 und 1 zu skalieren und den Datentyp als org.apache.spark.sql.DataFrame
beizubehalten %Vor%Ich habe die StandardScaler-Option gefunden, aber dazu muss das Dataset transformiert werden, bevor ich die Transformation durchführen kann. Gibt es einen einfachen, sauberen Weg.
Tags und Links scala apache-spark normalization apache-spark-sql