Für den folgenden Datenrahmen (df),
%Vor%Ich möchte einen gewichteten Boxplot zeichnen, wobei die Gewichte für jede Box durch ColA_weights und ColB_weights angegeben werden, ich mache einfach
%Vor%Es scheint jedoch keine Bestimmung für die Einbeziehung von Gewichtungen zu geben. Irgendwelche Lösungen?
Danke!
Wie in den Kommentaren vorgeschlagen, ist hier eine Möglichkeit, eine Liste mit jedem Eintrag so oft zu machen, wie es die Gewichtung anzeigt. Ich denke, das ist nicht die cleverste Lösung und jemand könnte sich eine bessere Lösung ausdenken.
Mein Beispiel wird nur auf die Spalte A angewendet, aber Sie sollten es in der gleichen Weise in Spalte B verwenden können:
%Vor%Pros: sehr einfache Lösung zu schreiben, theoretisch für alle Fälle arbeiten (wenn Ihre Gewichte nicht ganze Zahlen sind, müssten Sie sie konvertieren / runden Sie auf eine Weise, die Sie jedoch akzeptabel finden)
Nachteile: nicht sehr effizient, wenn Sie mit sehr großen Gewichtungen arbeiten, müssten Sie einen Weg finden, diese zu "verkleinern", um eine vernünftige Speichernutzung zu haben.