Complete.obs der Funktion cor ()

9

Ich erstelle eine Korrelationsmatrix für meine Daten, die so aussieht

%Vor%

Dies ergibt den folgenden Datenrahmen:

%Vor%

Normalerweise verwende ich einen Befehl complete.obs, um meine Korrelationsmatrix mit diesem Befehl zu erstellen

%Vor%

Meine Frage ist, wie behandeln die complete.obs die Daten? überspringt es irgendeine Reihe mit einem "NA" -Wert, macht eine "NA" freie Tabelle und erstellt gleichzeitig eine Korrelationsmatrix?

%Vor%

oder lassen sich "NA" -Werte paarweise weglassen, zum Beispiel wenn man die Korrelation zwischen V1 und V2 berechnet, erhält man die Zeile, die einen NA-Wert in V3 enthält (wie in meinem Beispiel die Zeilen 1 und 2) auch weggelassen?

Wenn das der Fall ist, freue ich mich darauf, einen Befehl zu erstellen, der so viel wie möglich der Daten reserviert, indem man die NA-Werte paarweise weglässt.

Vielen Dank,

    
Error404 19.09.2013, 10:19
quelle

1 Antwort

14

Sehen Sie sich die Hilfedatei für cor an, also ?cor . Insbesondere

  

Wenn "verwenden" "alles" ist, werden NAs konzeptionell propagieren, d   der sich ergebende Wert wird "NA" sein, wenn einer seiner Beiträge dazu beiträgt   Beobachtungen sind 'NA'.

     

Wenn "verwenden" ist "all.obs", dann das Vorhandensein von fehlenden Beobachtungen   wird einen Fehler erzeugen. Wenn 'verwenden' ist '' complete.obs '' dann fehlt   Werte werden durch fallweise Löschung behandelt (und wenn es keine vollständigen   Fälle, die einen Fehler ergeben).

Um ein besseres Gefühl dafür zu bekommen, was vor sich geht, soll ein (sogar) einfacheres Beispiel erstellt werden:

%Vor%

Wenn wir also complete.obs verwenden, wird die ganze Zeile verworfen, wenn ein NA vorhanden ist. In meinem Beispiel bedeutet dies, dass wir die Zeilen 1 und 2 verwerfen.% Co_de% verwendet jedoch die Werte für nicht pairwise.complete.obs bei der Berechnung der Korrelation zwischen NA und V1 .

    
csgillespie 19.09.2013, 10:22
quelle

Tags und Links