Nach Abschluss einer linearen Diskriminanzanalyse in R mit lda()
gibt es eine bequeme Möglichkeit, die Klassifizierungsfunktionen für jede Gruppe?
Über den Link
%Vor%Diese sind nicht mit den Diskriminanzfunktionen zu verwechseln. Die Klassifikationsfunktionen können verwendet werden, um zu bestimmen, zu welcher Gruppe jeder Fall am wahrscheinlichsten gehört. Es gibt so viele Klassifizierungsfunktionen wie es Gruppen gibt. Mit jeder Funktion können wir für jede Gruppe Klassifizierungswerte für jede Gruppe berechnen, indem wir die Formel anwenden:
In dieser Formel bezeichnet der Index i die jeweilige Gruppe; die Indizes 1, 2, ..., m bezeichnen die m Variablen; ci ist eine Konstante für die i-te Gruppe, wij ist das Gewicht für die j-te Variable bei der Berechnung des Klassifizierungswertes für die i-te Gruppe; xj ist der beobachtete Wert für den jeweiligen Fall für die j-te Variable. Si ist der resultierende Klassifizierungswert.
Wir können die Klassifizierungsfunktionen verwenden, um die Klassifizierungswerte für einige neue Beobachtungen direkt zu berechnen.
Ich kann sie mithilfe von Lehrbuchformeln von Grund auf neu erstellen, aber dafür müssen einige Zwischenschritte aus der lda-Analyse neu erstellt werden. Gibt es eine Möglichkeit, sie nach dem Fakt aus dem lda-Objekt zu bekommen?
Hinzugefügt:
Wenn ich noch nicht etwas in Brandons Antwort missverstanden habe (Entschuldigung für die Verwirrung!), scheint die Antwort nein zu sein. Vermutlich kann die Mehrheit der Benutzer die benötigten Informationen von predict()
erhalten, was Klassifizierungen basierend auf lda()
ermöglicht.
Aus pädagogischen Gründen mehr als ein ernsthafter Forschungsbedarf, wollte ich die eigentlichen Klassifizierungsfunktionen sehen, und für die Nachwelt ist dies eine Funktion, die sie an das lda()
-Ergebnis anfügt:
Dieser Code folgt den Formeln in Legendre und Legendres Numerical Ecology (1998), Seite 625 und stimmt mit den Ergebnissen des bearbeiteten Beispiels ab Seite 626 überein.
Angenommen, x ist Ihr LDA-Objekt:
%Vor%Sie können einen Höhepunkt am Objekt haben, indem Sie auf seine Struktur schauen:
%Vor%Aktualisierung:
%Vor%Ich denke, Ihre Frage war fehlerhaft ... OK, vielleicht nicht fehlerhaft, aber zumindest etwas irreführend. Die Diskriminanzfunktion (en) bezieht sich auf Abstände zwischen Gruppen, so dass keine Funktion einer einzelnen Gruppe zugeordnet ist, sondern eine Funktion, die die Abstände zwischen zwei beliebigen Gruppenschwerpunkten beschreibt. Ich habe gerade eine neuere Frage beantwortet und legte ein Beispiel für die Berechnung einer Score-Funktion mit dem Iris-Dataset und die Verwendung dieser, um Fälle in einem 2d-Plot von Prädiktoren zu kennzeichnen. Im Fall einer 2-Gruppen-Analyse ist die Funktion für eine Gruppe größer als Null und für die andere Gruppe kleiner als Null.
Tags und Links r classification