Ich versuche die Funktion lmer zu verstehen. Ich habe viele Informationen darüber gefunden, wie man den Befehl benutzt, aber nicht viel darüber, was er eigentlich macht (abgesehen von einigen kryptischen Kommentaren hier: Ссылка ). Ich spiele mit dem folgenden einfachen Beispiel:
%Vor%Ich verstehe, dass lmer ein Modell der Form Y_ {ij} = beta + B_i + epsilon_ {ij} anpasst, wobei epsilon_ {ij} und B_i unabhängige Normale mit den Varianzen sigma ^ 2 bzw. tau ^ 2 sind. Wenn Theta = Tau / Sigma festgelegt ist, berechnete ich die Schätzung für Beta mit der korrekten mittleren und minimalen Varianz als
%Vor%wo
%Vor% Ich habe auch die folgende unvoreingenommene Schätzung für Sigma ^ 2 berechnet:
s ^ 2 = \ Summe_ {i, j} alpha_i (y_ {ij} - c) ^ 2 / (1 + θ ^ 2 - Lambda)
Diese Schätzungen scheinen mit dem übereinzustimmen, was lmer produziert. Ich kann jedoch nicht herausfinden, wie Log-Likelihood in diesem Zusammenhang definiert ist. Ich berechnete die Wahrscheinlichkeitsdichte zu
%Vor%wo
%Vor%Aber log von dem oben genannten ist nicht was lmer produziert. Wie wird in diesem Fall die Log-Wahrscheinlichkeit berechnet (und für Bonus-Marken, warum)?
Bearbeiten: Änderung der Schreibweise für Konsistenz, ausgedrückte falsche Formel für die Schätzung der Standardabweichung.
Die Links in den Kommentaren enthielten die Antwort. Im Folgenden habe ich in diesem einfachen Beispiel erklärt, was die Formeln vereinfachen, da die Ergebnisse etwas intuitiv sind.
lmer passt ein Modell der Form , wobei und sind unabhängige Normalen mit Abweichungen . Die gemeinsame Wahrscheinlichkeitsverteilung von und ist also
wo
.
Die Wahrscheinlichkeit wird erhalten, indem man dies in (was nicht beobachtet wird) integriert, um
zu geben
wobei die Anzahl der Beobachtungen aus der Gruppe und ist der Mittelwert der Beobachtungen aus der Gruppe . Dies ist etwas intuitiv, da sich die ersten Terme innerhalb jeder Gruppe verbreiten, die eine Abweichung haben sollte, und die zweite fängt den Spread ein zwischen Gruppen. Beachten Sie, dass die Varianz von .
Standardmäßig (REML = T) maximiert lmer jedoch nicht die Likelihood, sondern das "REML-Kriterium", das durch zusätzliche Integration in geben
wobei unten angegeben ist.
Wenn behoben ist, können wir explizit und welche die Wahrscheinlichkeit maximieren. Sie erweisen sich als
Hinweis hat zwei Begriffe für Variationen innerhalb und zwischen Gruppen und liegt irgendwo zwischen dem Mittelwert von und der Mittelwert von abhängig vom Wert von .
Indem wir diese in Likelihood einsetzen, können wir die Log-Wahrscheinlichkeit im Sinne von nur:
lmer iteriert, um den Wert von zu finden, der dies minimiert.In der Ausgabe und werden in den Feldern "deviance" und "logLik" (wenn REML = F) angezeigt.
Da das REML-Kriterium nicht von abhängt, verwenden wir dieselbe Schätzung für wie oben. Wir schätzen , um das REML-Kriterium zu maximieren:
Die eingeschränkte Protokollwahrscheinlichkeit wird von
angegeben
In der Ausgabe von lmer, und werden in den Feldern" REMLdev "und" logLik "(wenn REML = T) angezeigt.