Es ist schwierig, %code% -dimensionale Daten darzustellen. Eine Möglichkeit, dies zu tun, besteht darin, über Hauptkomponentenanalyse (PCA) in einen 2D-Raum zu mappen. Sobald wir das getan haben, können wir sie mit matplotlib auf eine Handlung werfen (basierend auf dieser Antwort ).
> %Vor%
Wenn Sie etwas anderes als Zahlen darstellen möchten, ändern Sie einfach das erste Argument in %code% . Sie können zum Beispiel Benutzernamen oder so etwas tun.
Beachten Sie, dass die Cluster in diesem Bereich möglicherweise leicht "falsch" aussehen (z. B. 15 scheint näher an Rot als unten), da es sich nicht um den tatsächlichen Speicherplatz handelt. In diesem Fall behalten die ersten beiden Komponenten 61 % der Varianz:
%Vor% Es ist schwierig, m
-dimensionale Daten darzustellen. Eine Möglichkeit, dies zu tun, besteht darin, über Hauptkomponentenanalyse (PCA) in einen 2D-Raum zu mappen. Sobald wir das getan haben, können wir sie mit matplotlib auf eine Handlung werfen (basierend auf dieser Antwort ).
Wenn Sie etwas anderes als Zahlen darstellen möchten, ändern Sie einfach das erste Argument in annotate
. Sie können zum Beispiel Benutzernamen oder so etwas tun.
Beachten Sie, dass die Cluster in diesem Bereich möglicherweise leicht "falsch" aussehen (z. B. 15 scheint näher an Rot als unten), da es sich nicht um den tatsächlichen Speicherplatz handelt. In diesem Fall behalten die ersten beiden Komponenten 61 % der Varianz:
%Vor%Tags und Links python cluster-analysis k-means