Ich habe ein 2-D-Histogramm so geplottet, dass ich es mit Linien, Punkten usw. zum Plot hinzufügen kann. Jetzt versuche ich eine lineare Regressionsanpassung in der Region von dichten Punkten anzuwenden, aber meine lineare Regressionslinie scheint völlig ausgeschaltet zu sein, wo sie sein sollte? Um hier zu zeigen, ist meine Handlung auf der linken Seite mit einer geringen Regressionsanpassung und einer linearen Anpassung.
%Vor%Hier sind a und b meine Werte und cc sind die Punkte innerhalb der dichtesten Teile (d. h. die meisten Punkte liegen dort), rot + gelb + blau.
Warum sieht meine Regressionslinie nicht mehr so aus wie auf der rechten Seite (handgezeichnete Anpassung)? Wenn ich eine Linie der besten Anpassung plant, wäre es da?
Ich habe zahlreiche ähnliche Plots, aber trotzdem bekomme ich die gleichen Ergebnisse ....
Gibt es alternative lineare Regressionsanpassungen, die sich für mich als besser erweisen könnten?
Eine lineare Regression ist eine Methode, um eine lineare Funktion an eine Menge von Punkten (Beobachtungen) anzupassen, die den Fehler der kleinsten Quadrate minimiert.
Stellen Sie sich nun vor, Ihre Heatmap zeigt eine Form an, in der Sie eine vertikale Linie am besten annehmen würden. Drehen Sie einfach Ihre Heatmap um 10 Grad gegen den Uhrzeigersinn und Sie haben es.
Wie soll nun eine lineare Funktion definiert werden, die vertikal ist? Genau, es ist nicht möglich.
Das Ergebnis dieses kleinen Gedankenexperiments ist, dass Sie den Zweck der linearen Regression verwechseln und was Sie am wahrscheinlichsten wollen, ist - wie bereits von Gavin Simpson angedeutet - der erste Hauptkomponentenvektor .
Tags und Links r linear-regression scatter-plot best-fit