Entfernte Funktion für gemischte Variablen (kategorisch und numerisch)

8

Ich möchte einen Satz von Jobs unscharf zusammenfassen. Auftragsattribute sind:

  1. Kategorisch : Position, Diplom, Fähigkeiten
  2. Numerisch : Gehalt, langjährige Erfahrung

Meine Frage ist: Wie berechnet man die Entfernung zwischen verschiedenen Jobs?
                  z. B. job1 (Programmierer, bs Informatik, (Java, .net, Verantwortung), 1500, 3)
und job2 (Tester, BS Informatik, (Schwarz-Weiß-Box-Test), 1200,1)

PS: Ich bin ein Anfänger im Data Mining Clustering, ich schätze Ihre Hilfe sehr.

    
Mariya 07.08.2011, 14:27
quelle

2 Antworten

3

Sie können dies als Ausgangspunkt nehmen: Ссылка . Die Entfernung zwischen kategorischen Daten wird am Ende schön erklärt.

    
iinception 07.08.2011, 16:49
quelle
2

Hier finden Sie einen guten Überblick über verschiedene Cluster-Methoden und deren Verwendung in R: Ссылка

Im Allgemeinen bezieht sich das Clustering für diskrete Daten entweder auf die Verwendung von Zählwerten (z. B. Überlappungen in Vektoren) oder auf einige aus Zählwerten abgeleitete Statistiken. So sehr ich die statistische Seite ansprechen möchte, ich nehme an, Sie interessieren sich für den Algorithmus, also überlasse ich das.

    
Iterator 08.08.2011 21:30
quelle