Ich erstelle eine Korrelationsmatrix für meine Daten, die so aussieht
%Vor%Dies ergibt den folgenden Datenrahmen:
%Vor%Normalerweise verwende ich einen Befehl complete.obs, um meine Korrelationsmatrix mit diesem Befehl zu erstellen
%Vor%Meine Frage ist, wie behandeln die complete.obs die Daten? überspringt es irgendeine Reihe mit einem "NA" -Wert, macht eine "NA" freie Tabelle und erstellt gleichzeitig eine Korrelationsmatrix?
%Vor%oder lassen sich "NA" -Werte paarweise weglassen, zum Beispiel wenn man die Korrelation zwischen V1 und V2 berechnet, erhält man die Zeile, die einen NA-Wert in V3 enthält (wie in meinem Beispiel die Zeilen 1 und 2) auch weggelassen?
Wenn das der Fall ist, freue ich mich darauf, einen Befehl zu erstellen, der so viel wie möglich der Daten reserviert, indem man die NA-Werte paarweise weglässt.
Vielen Dank,
Sehen Sie sich die Hilfedatei für cor
an, also ?cor
. Insbesondere
Wenn "verwenden" "alles" ist, werden NAs konzeptionell propagieren, d der sich ergebende Wert wird "NA" sein, wenn einer seiner Beiträge dazu beiträgt Beobachtungen sind 'NA'.
Wenn "verwenden" ist "all.obs", dann das Vorhandensein von fehlenden Beobachtungen wird einen Fehler erzeugen. Wenn 'verwenden' ist '' complete.obs '' dann fehlt Werte werden durch fallweise Löschung behandelt (und wenn es keine vollständigen Fälle, die einen Fehler ergeben).
Um ein besseres Gefühl dafür zu bekommen, was vor sich geht, soll ein (sogar) einfacheres Beispiel erstellt werden:
%Vor% Wenn wir also complete.obs
verwenden, wird die ganze Zeile verworfen, wenn ein NA
vorhanden ist. In meinem Beispiel bedeutet dies, dass wir die Zeilen 1 und 2 verwerfen.% Co_de% verwendet jedoch die Werte für nicht pairwise.complete.obs
bei der Berechnung der Korrelation zwischen NA
und V1
.
Tags und Links r na matrix correlation