Ich versuche in einem Spark-Datenrahmen nach Datum zu gruppieren und zähle für jede Gruppe die eindeutigen Werte einer Spalte:
%Vor%Und der Code:
%Vor%Die Ergebnisse mit pyspark sind
%Vor%Und was ich erwarte, ist so etwas mit Pandas:
%Vor%Wie kann ich die einzigartigen Elemente jeder Gruppe durch ein anderes Feld, wie Adresse, erhalten?
Tags und Links python apache-spark pyspark