dplyr

Verwenden Sie dieses Tag für Fragen zu Funktionen aus dem dplyr-Paket, z. B. group_by, summarisieren, filtern und auswählen.
2
Antworten

Wie kombiniere ich ggplot und dplyr zu einer Funktion?

Betrachten Sie dieses einfache Beispiel %Vor% Hier möchte ich eine Funktion schreiben, die den Datenrahmen und die Gruppierungsvariable als Eingabe verwendet. Im Idealfall möchte ich nach dem Gruppieren und Aggregieren ein ggpplot Diagr...
22.08.2017, 18:15
2
Antworten

Implizite Sortierung in tidyr :: spread und dplyr :: summarize

Meine Daten sind geordnete Beobachtungen und ich möchte die Reihenfolge so gut wie möglich bei Manipulationen beibehalten. Nehmen Sie die Antwort für diese Frage , ich setze "B" voraus von "A" im Datenrahmen. Die resultierenden breiten Daten...
01.04.2015, 00:50
3
Antworten

Zusammenfassen (Anzahl / Häufigkeit) nach Behandlungsart, bei der beide Behandlungen erhalten werden können

Sagen wir, wir haben diese Daten: %Vor% Dabei steht ID für die Subjekt-ID und Rx für die Behandlung, die sie erhalten haben. So gibt es wiederholte Beobachtungen und die Behandlung kann oder kann nicht konsistent sein pro Thema. Ich möcht...
04.02.2015, 16:20
1
Antwort

Die benutzerdefinierte Summenfunktion in dplyr gibt inkonsistente Ergebnisse zurück

Ich habe eine benutzerdefinierte Summenfunktion erstellt, die NA s ignoriert, sofern nicht alle NA sind. Wenn ich es in dplyr verwende, gibt es seltsame Ergebnisse zurück und ich weiß nicht warum. %Vor% gibt mir %Vor% In diesem...
14.10.2014, 01:14
2
Antworten

Schnellster Weg, um eine 21-tägige rollende Summe für einen ActivityType zu erstellen

Ich habe einen großen Datenrahmen (3M + Zeilen). Ich versuche zu zählen, wie oft ein bestimmter ActivityType in einem 21-Tage-Fenster angezeigt wird. Ich habe meine Lösung aus rollende Summe durch eine andere Variable in R . Aber es dauert lang...
24.12.2015, 17:04
1
Antwort

Index von cummax in einem dplyr muate finden?

Ich habe den folgenden Code: %Vor% welche Ausgaben %Vor% Ich möchte eine weitere mutierte Spalte hinzufügen, die die Nummer / den Index hinzufügt, von dem max_then berechnet wurde. Ich stelle mir vor, dass es so etwas wie folgt sein wird...
20.07.2015, 20:45
3
Antworten

Erstellen von variablen Indikatorspalten in der dplyr-Kette

Aktualisiert : Entschuldigung für die Antworten, in meinem ursprünglichen Beispiel habe ich übersehen, dass data.frame() var als Faktor und nicht als Zeichenvektor erstellt hat, wie ich es beabsichtigt hatte. Ich habe das Beispiel korrigi...
11.03.2016, 15:02
1
Antwort

dplyr Zählnummer eines bestimmten Wertes der Variablen

Sagen Sie, ich habe einen Datensatz wie folgt: %Vor% I.e., %Vor% Wie würde ich mit dplyr herausfinden, wieviele a's für jede ID vorhanden sind? d. h. %Vor% Ich probiere Sachen wie diese aus, die nicht funktionieren, %Vor% Das...
30.03.2016, 16:57
2
Antworten

R dplyr-Filter maskiert den Basisfilter nicht? [Duplikat]

Bei der Arbeit habe ich einen Windows 7 Computer mit R 3.1.2. Ich habe eine Datei namens packages.R. In meiner Datei habe ich folgenden Code: %Vor% My .Rprofile enthält eine Funktion namens .First. %Vor% Wenn ich R lade, bekomme ich...
14.11.2014, 16:57
2
Antworten

R Programmierung mit "dplyr", um Zeilen auszuwählen und den Index der gefundenen Zeilen zurückzugeben

Setup / Problem: Verwenden von dplyr - Ich kann nicht den optimalen Weg zum Zurückgeben des Zeilenindex einer gefilterten Zeile bestimmen, im Gegensatz zum Zurückgeben des Inhalts der gefilterten Zeile. Problem: Ich kann dplyr :: filter...
17.01.2015, 22:06