Ich versuche die Funktion lmer zu verstehen. Ich habe viele Informationen darüber gefunden, wie man den Befehl benutzt, aber nicht viel darüber, was er eigentlich macht (abgesehen von einigen kryptischen Kommentaren hier: Ссылка ). Ich spiele mit dem folgenden einfachen Beispiel:
%Vor%Ich verstehe, dass lmer ein Modell der Form Y_ {ij} = beta + B_i + epsilon_ {ij} anpasst, wobei epsilon_ {ij} und B_i unabhängige Normale mit den Varianzen sigma ^ 2 bzw. tau ^ 2 sind. Wenn Theta = Tau / Sigma festgelegt ist, berechnete ich die Schätzung für Beta mit der korrekten mittleren und minimalen Varianz als
%Vor%wo
%Vor% Ich habe auch die folgende unvoreingenommene Schätzung für Sigma ^ 2 berechnet:
s ^ 2 = \ Summe_ {i, j} alpha_i (y_ {ij} - c) ^ 2 / (1 + θ ^ 2 - Lambda)
Diese Schätzungen scheinen mit dem übereinzustimmen, was lmer produziert. Ich kann jedoch nicht herausfinden, wie Log-Likelihood in diesem Zusammenhang definiert ist. Ich berechnete die Wahrscheinlichkeitsdichte zu
%Vor%wo
%Vor%Aber log von dem oben genannten ist nicht was lmer produziert. Wie wird in diesem Fall die Log-Wahrscheinlichkeit berechnet (und für Bonus-Marken, warum)?
Bearbeiten: Änderung der Schreibweise für Konsistenz, ausgedrückte falsche Formel für die Schätzung der Standardabweichung.
Die Links in den Kommentaren enthielten die Antwort. Im Folgenden habe ich in diesem einfachen Beispiel erklärt, was die Formeln vereinfachen, da die Ergebnisse etwas intuitiv sind.
lmer passt ein Modell der Form , wobei
und
sind unabhängige Normalen mit Abweichungen
. Die gemeinsame Wahrscheinlichkeitsverteilung von
und
ist also
wo
.
Die Wahrscheinlichkeit wird erhalten, indem man dies in (was nicht beobachtet wird) integriert, um
wobei die Anzahl der Beobachtungen aus der Gruppe
und
ist der Mittelwert der Beobachtungen aus der Gruppe
. Dies ist etwas intuitiv, da sich die ersten Terme innerhalb jeder Gruppe verbreiten, die eine Abweichung
haben sollte, und die zweite fängt den Spread ein zwischen Gruppen. Beachten Sie, dass
die Varianz von
.
Standardmäßig (REML = T) maximiert lmer jedoch nicht die Likelihood, sondern das "REML-Kriterium", das durch zusätzliche Integration in geben
wobei unten angegeben ist.
Wenn behoben ist, können wir explizit
und
welche die Wahrscheinlichkeit maximieren. Sie erweisen sich als
Hinweis hat zwei Begriffe für Variationen innerhalb und zwischen Gruppen und
liegt irgendwo zwischen dem Mittelwert von
und der Mittelwert von
abhängig vom Wert von
.
Indem wir diese in Likelihood einsetzen, können wir die Log-Wahrscheinlichkeit im Sinne von
nur:
lmer iteriert, um den Wert von zu finden, der dies minimiert.In der Ausgabe
und
werden in den Feldern "deviance" und "logLik" (wenn REML = F) angezeigt.
Da das REML-Kriterium nicht von abhängt, verwenden wir dieselbe Schätzung für
wie oben. Wir schätzen
, um das REML-Kriterium zu maximieren:
Die eingeschränkte Protokollwahrscheinlichkeit wird von
In der Ausgabe von lmer, und
werden in den Feldern" REMLdev "und" logLik "(wenn REML = T) angezeigt.