Umwandlung von Daten in Normalität. Was ist die beste Funktion für einen bestimmten Fall?

8

Gibt es eine Funktion oder ein Paket, das es erlaubt, nach der besten (oder einer der besten) Variablentransformation zu suchen, um die Residuen des Modells so normal wie möglich zu machen?

Zum Beispiel:

%Vor%

Gibt es eine Funktion, die angibt, was die Funktion some_transformation() ist, die die Normalität der Residuen optimiert?

    
Remi.b 27.08.2013, 11:45
quelle

2 Antworten

6

Sie meinen die Box-Cox-Transformation?

%Vor%

%Vor%

    
Roland 27.08.2013, 12:05
quelle
6
___ tag123r ___ R ist eine freie, quelloffene Programmiersprache und Softwareumgebung für statistische Berechnungen, Bioinformatik, Visualisierung und allgemeine Datenverarbeitung. Stellen Sie minimale, reproduzierbare, repräsentative Beispiele für Ihre Fragen bereit. Verwenden Sie dput () für Daten und geben Sie alle Nicht-Basis-Pakete mit Bibliotheksaufrufen an. Bilder für Daten oder Code nicht einbetten, eingerückte Codeblöcke verwenden. Verwenden Sie für statistische Fragen http://stats.stackexchange.com. ___ qstnhdr ___ Umwandlung von Daten in Normalität. Was ist die beste Funktion für einen bestimmten Fall? ___ answer18464910 ___

Sie meinen die Box-Cox-Transformation?

%Vor%

%Vor%

    
___ tag123statistics ___ Überlegen Sie, ob Ihre Frage unter http://stats.stackexchange.com besser ist. Statistik ist die mathematische Studie der Wahrscheinlichkeit, aus einer begrenzten Anzahl von Stichproben oder Beobachtungen auf Merkmale einer Population zu schließen. ___ qstntxt ___

Gibt es eine Funktion oder ein Paket, das es erlaubt, nach der besten (oder einer der besten) Variablentransformation zu suchen, um die Residuen des Modells so normal wie möglich zu machen?

Zum Beispiel:

%Vor%

Gibt es eine Funktion, die angibt, was die Funktion shapiro.test ist, die die Normalität der Residuen optimiert?

    
___ answer18464714 ​​___

Leider ist das in der Statistik kein gelöstes Problem. Was Benutzer @statquant vorgeschlagen hat, ist so gut wie das Beste, was Sie tun können, aber es ist nicht ohne eigene Fallstricke.

Es ist wichtig zu beachten, dass Tests auf Normalität, wie %code% , sehr empfindlich auf Veränderungen reagieren, sobald Sie vernünftige Stichprobengrößen (d. h. Hunderte) erreicht haben, also sollten Sie sich nicht blind darauf verlassen.

Ich selbst habe das Problem in den zu harten Korb geworfen. Wenn die Daten nicht mindestens normalverteilt aussehen, würde ich versuchen, eine nichtparametrische Version der Statistiken zu finden, die Sie auf den Daten ausführen möchten.

    
___ tag123normalverteilung ___ Die Normalverteilung ist eine Annahme vieler parametrischer statistischer Tests und ist typischerweise mit einer Gaußschen Verteilung verbunden, oft mit Mittelwert = 0 und Standardabweichung = 1. Die "Glockenkurve" ist das visuelle, intuitive Modell für diese Verteilung. Gaußsche Verteilungen sind mit der Funktion verbunden: f (x) = [1 / (σ√2π)] e ^ (- [(x-μ) ^ 2] / (2σ ^ 2)) ___
Scott Ritchie 27.08.2013 11:57
quelle