Also habe ich einen dreispaltigen Datenrahmen, der Trials, Ind. Variable, Observation hat. Etwas wie:
df1<- data.frame(Trial=rep(1:10,5), Variable=rep(1:5, each=10), Observation=rnorm(1:50))
Ich versuche ein 95% conf zu zeichnen. Intervall um den Mittelwert für jede Studie mit einer eher ineffizienten Methode wie folgt:
%Vor%Dies ist ineffizient, da es Werte für ymin, ymax dupliziert. Ich habe die Geom_Ribbon-Methoden gesehen, aber ich müsste noch duplizieren. Allerdings, wenn ich irgendeine Art von Glättung wie Glm verwendet, ist der Code viel einfacher ohne Duplizierung. Gibt es einen besseren Weg, dies zu tun?
Referenzen: 1. R Plotten von Vertrauensbändern mit ggplot 2. Schattierung der Konfidenzintervalle manuell mit ggplot2 3. Ссылка
Mit dieser Methode erhalte ich die gleiche Ausgabe wie bei Ihrer Methode. Dies wurde von den Dokumenten für ggplot inspiriert. Auch dies ist sinnvoll, solange jeder x
-Wert mehrere Punkte hat.
Das Paket ggplot
enthält Wrapper für eine Reihe von zusammenfassenden Funktionen im Paket Hmisc
, einschließlich
mean_cl_normal
berechnet die Konfidenzgrenzen basierend auf der T-Verteilung, mean_cl_boot
verwendet eine Bootstrap-Methode, die keine Verteilung des Mittelwerts annimmt, mean_sdl
, das ein Vielfaches der Standardabweichung verwendet (Standard = 2). Diese letztere Methode ist die gleiche wie in der obigen Antwort, ist aber nicht die 95% CL. Vertrauensgrenzen basierend auf der t-Verteilung sind gegeben durch:
CL = t × s / √ n
Dabei ist t das geeignete Quantil der t-Verteilung und s die Standardabweichung der Stichprobe. Vergleichen Sie die Konfidenzbänder:
%Vor%%Vor%
Schließlich erzeugt das Drehen dieses letzten Plots mit coord_flip()
etwas, das sehr nahe bei Forest Plot
liegt. Dies ist eine Standardmethode zum Zusammenfassen von Daten wie deins.
Tags und Links r ggplot2 confidence-interval