Verwenden der Genauigkeitsaufrufmetrik für eine Hierarchie wiederhergestellter Cluster

9

Kontext: Wir sind zwei Studenten, die beabsichtigen, eine Thesis über reverse engineering-Namespaces mit hierarchischen agglomerativen Clustering-Algorithmen zu schreiben. Wir haben eine Variation von Verknüpfungsmethoden und andere Optimierungen an dem Algorithmus, den wir ausprobieren wollen. Wir werden den Algorithmus auf populären GitHub-Repositories ausführen und die erstellten Cluster mit den ursprünglich vorhandenen Namespaces vergleichen. Unsere Arbeit wird den Arbeiten von dieses Papier. In der Arbeit erwähnen die Autoren die Verwendung der "Präzisions-Rückruf-Metrik", um die Genauigkeit des Clustering-Algorithmus zu messen. Bei näherer Betrachtung der Metrik und ihres Ursprungs scheint sie jedoch flachen (nicht-hierarchischen) Clustern zuzuordnen.

Frage: Gibt es eine Möglichkeit, die Präzisions-Rückrufmetrik zu verwenden, um die Genauigkeit einer Hierarchie von wiederhergestellten Clustern zu messen? Wenn nicht, welche anderen Optionen gibt es?

    
David 05.04.2016, 10:51
quelle

0 Antworten