Beim Vergleich verschiedener Teilmodelle ist es notwendig, dass sie an die gleichen Daten angepasst werden - ansonsten sind die Ergebnisse einfach nicht sinnvoll. (Betrachten Sie die extreme Situation, in der Sie zwei Prädiktoren A
und B
haben, die jeweils nur für die Hälfte Ihrer Beobachtungen gemessen werden. Dann wird das Modell y~A+B
an alle Daten angepasst, aber die Modelle y~A
und y~B
wird an nicht überlappende Teilmengen der Daten angepasst. Daher erlaubt step
das Vergleichen von Teilmodellen, die (aufgrund der automatischen Entfernung von Fällen mit NA
-Werten) nicht möglich sind ) verwenden unterschiedliche Teilmengen des ursprünglichen Datensatzes.
Die Verwendung von na.omit
auf dem ursprünglichen Datensatz sollte das Problem beheben.
Wenn Sie jedoch viele NA
-Werte in verschiedenen Prädiktoren haben, können Sie am Ende einen Großteil Ihres Datensatzes verlieren - im Extremfall könnten Sie den ganzen Datensatz verlieren . Wenn dies passiert, müssen Sie Ihre Modellierungsstrategie überdenken ...
Tags und Links r