Ich arbeite an einem logistischen Regressionsmodell mit einem kontinuierlichen Prädiktor und einem kategorischen Prädiktor mit mehreren Ebenen. Ich möchte die Ergebnisse mit ggplot2
darstellen und die facet_wrap
ausnutzen, um die Regressionslinien für jede Ebene des kategorischen Prädiktors anzuzeigen. Dabei habe ich festgestellt, dass die angepasste Kurve von stat_smooth
nur die Daten einer bestimmten Facette berücksichtigt, nicht den gesamten Datensatz. Dies ist ein kleiner Unterschied, aber ein wahrnehmbarer Unterschied, wenn man den Plot gegenüber den vorhergesagten Werten von predict.glm
betrachtet.
Hier ist ein Beispiel, das das Problem mit der Grafik nach dem Code neu erstellt.
%Vor%
Was ich bemerkt habe und um das ich mich Sorgen mache, ist die Leichtigkeit in Facette B zu sehen. Die roten Kurven sind die vorhergesagten Werte von Modellen, die nur eine Position berücksichtigen, während die grünen Kurven Vorhersagen unter Verwendung des gesamten Datensatzes sind. Die Modelle, die auf der Teilmenge der Daten basieren, stimmen mit dem Diagramm aus stat_smooth
überein.
Ich möchte mit Standardfehlerschattierung die grünen Kurven über ggplot2
darstellen. Ich bin mir sicher, dass es irgendwo im Code eine Option gibt, die das tun könnte, aber ich muss es noch finden, oder vielleicht gibt es eine andere Reihenfolge oder Schritte, die ich befolgen sollte, um die grünen Kurven von ggplot
zu erhalten. Anruf. Ich habe ähnliche Probleme gefunden, wenn ich alles auf einer Facette zeichne und die Farb- oder Gruppenästhetik verwende.
Irgendwelche Vorschläge würden sehr geschätzt werden.
Es stimmt, dass Sie dazu das Modell außerhalb von ggplot2 anpassen und dann die angepassten Werte und Intervalle wie gewünscht berechnen und diese Daten separat übergeben.
Ein Weg, um das zu erreichen, was Sie beschreiben, wäre etwa so:
%Vor%
Dies wird mit den üblichen Warnungen über Intervalle bei angepassten Werten geliefert: Es liegt an Ihnen, sicherzustellen, dass das Intervall, das Sie planen, das ist, was Sie wirklich wollen. Bei "Prädiktionsintervallen" herrscht oft Unklarheit.