statistics, Seitenzahl 5

Überlegen Sie, ob Ihre Frage unter http://stats.stackexchange.com besser ist. Statistik ist die mathematische Studie der Wahrscheinlichkeit, aus einer begrenzten Anzahl von Stichproben oder Beobachtungen auf Merkmale einer Population zu schließen.

Antworten

Wie benutzt man die for-Schleife mit der Funktion, die für ein String-Feld benötigt wird?

Ich verwende das smbinning R-Paket, um den Variableninformationswert zu berechnen, der in meiner Datenmenge enthalten ist. Die Funktion smbinning() ist ziemlich einfach und muss wie folgt verwendet werden: %Vor% Also ist df das zu...

06.02.2016, 16:08

Antwort

Beispiel für die Implementierung von Baum-Welch

Ich versuche, etwas über den Baum-Welch-Algorithmus zu lernen (mit einem versteckten Markov-Modell). Ich verstehe die grundlegende Theorie von Vorwärts-Rückwärts-Modellen, aber es wäre schön, wenn jemand mit etwas Code dazu beitragen würde, es z...

31.10.2011, 19:35

Antworten

nrow (Matrix) -Funktion

Ich habe eine Zuweisung mit R und habe ein kleines Problem. In der Zuweisung müssen mehrere Matrizen mit einer zufälligen Anzahl von Zeilen erzeugt und später für verschiedene Berechnungen verwendet werden. Alles funktioniert perfekt, es sei den...

12.05.2012, 10:08

Antwort

Statistik Frage: Kernel Smoothing in R

Ich habe Daten dieses Formulars: %Vor% Ich zeichne gerade eine kernel-geglättete Dichteabschätzung des x gegen y unter Verwendung dieses Codes: %Vor% Ich möchte einfach eine Darstellung der x gegen geglätteten (y) Werte, die ## Heading #...

11.06.2010, 18:18

Antwort

Perzentil Rang in Pandas in Gruppen

Ich kann nicht recht herausfinden, wie man eine Funktion schreibt, um ein gruppiertes Perzentil zu erreichen. Ich habe alle Teams aus den Jahren 1985-2012 in einem Datenrahmen; die ersten 10 werden unten angezeigt: es ist derzeit nach Jahr sorti...

12.03.2014, 00:46

Antwort

Warum liefert SciPy negative P-Werte für extrem kleine p-Werte mit dem Fisher-exact Test?

Ich habe bemerkt, dass der Fisher-exakte Test in SciPy einen negativen p-Wert zurückgibt, wenn der p-Wert extrem klein ist: %Vor% In R unter Verwendung derselben 2x2-Kontingenztabelle: %Vor% Meine Frage ist 1) Warum gibt SciPy einen nega...

21.09.2011, 17:43

Antworten

NLTK / NLP, das einen Viele-zu-Viele / Multi-Label-Subjekt-Klassifikator enthält

Ich habe ein menschliches etikettiertes Korpus von über 5000 indizierten Dokumenten in XML. Sie variieren in der Größe von ein paar hundert Kilobytes bis zu ein paar hundert Megabyte. Kurze Artikel zu Manuskripten sein. Sie wurden alle so tief w...

12.10.2011, 15:52

Antworten

Wie interpretiere ich die obere / untere Grenze eines Datenpunktes mit Konfidenzintervallen?

Gegeben eine Liste von Werten: %Vor% Unter Verwendung des Student-t-Tests kann ich das Konfidenzintervall der Verteilung im Mittel mit einem Alpha von 0,1 (d. h. bei 90% Konfidenz) mit: finden %Vor% [out]: %Vor% Aber wenn ich das Kon...

15.03.2017, 00:23

Antworten

Erzeugen von korrelierten Zahlen

Hier ist ein Spaß: Ich muss zufällige x / y-Paare erzeugen, die bei einem gegebenen Wert von Pearson-Produkt korreliert sind Momentenkorrelationskoeffizient oder Pearson r . Man kann sich dies als zwei Arrays vorstellen, Array X und Array Y, wo...

11.11.2009, 20:41

Antworten

Algorithmus (e) zum Aufspüren von Anomalien ("Spikes") in Verkehrsdaten

Ich muss den Netzwerkverkehr verarbeiten, der mit tcpdump erfasst wurde. Das Lesen des Verkehrs ist nicht schwer, aber was ein bisschen schwierig ist, ist zu sehen, wo es "Spikes" im Verkehr gibt. Ich bin hauptsächlich mit TCP-SYN-Paketen bes...

08.02.2010, 13:55