Ich möchte einen Satz von Jobs unscharf zusammenfassen. Auftragsattribute sind:
Meine Frage ist: Wie berechnet man die Entfernung zwischen verschiedenen Jobs?
z. B. job1 (Programmierer, bs Informatik, (Java, .net, Verantwortung), 1500, 3)
und job2 (Tester, BS Informatik, (Schwarz-Weiß-Box-Test), 1200,1)
PS: Ich bin ein Anfänger im Data Mining Clustering, ich schätze Ihre Hilfe sehr.
Sie können dies als Ausgangspunkt nehmen: Ссылка . Die Entfernung zwischen kategorischen Daten wird am Ende schön erklärt.
Hier finden Sie einen guten Überblick über verschiedene Cluster-Methoden und deren Verwendung in R: Ссылка
Im Allgemeinen bezieht sich das Clustering für diskrete Daten entweder auf die Verwendung von Zählwerten (z. B. Überlappungen in Vektoren) oder auf einige aus Zählwerten abgeleitete Statistiken. So sehr ich die statistische Seite ansprechen möchte, ich nehme an, Sie interessieren sich für den Algorithmus, also überlasse ich das.
Tags und Links cluster-analysis data-mining distance