Warum liefert SciPy negative P-Werte für extrem kleine p-Werte mit dem Fisher-exact Test?

8

Ich habe bemerkt, dass der Fisher-exakte Test in SciPy einen negativen p-Wert zurückgibt, wenn der p-Wert extrem klein ist:

%Vor%

In R unter Verwendung derselben 2x2-Kontingenztabelle:

%Vor%

Meine Frage ist 1) Warum gibt SciPy einen negativen p-Wert zurück? 2) Wie kann ich mit SciPy den richtigen p-Wert erzeugen?

Danke für die Hilfe.

    
drbunsen 21.09.2011, 17:43
quelle

1 Antwort

10
___ tag123python ___ Python ist eine dynamische und stark typisierte Programmiersprache, die die Usability betont. Zwei ähnliche, aber größtenteils inkompatible Versionen von Python sind weit verbreitet (2 und 3). Wenn Sie eine versionsspezifische Python-Frage haben, sollten Sie die Tags [python-2.7] oder [python-3.x] zusätzlich zum Tag [python] verwenden. Wenn Sie eine Python-Variante wie jython, pypy, iron-python usw. verwenden, kennzeichnen Sie diese bitte entsprechend. ___ qstntxt ___

Ich habe bemerkt, dass der Fisher-exakte Test in SciPy einen negativen p-Wert zurückgibt, wenn der p-Wert extrem klein ist:

%Vor%

In R unter Verwendung derselben 2x2-Kontingenztabelle:

%Vor%

Meine Frage ist 1) Warum gibt SciPy einen negativen p-Wert zurück? 2) Wie kann ich mit SciPy den richtigen p-Wert erzeugen?

Danke für die Hilfe.

    
___ tag123statistics ___ Überlegen Sie, ob Ihre Frage unter http://stats.stackexchange.com besser ist. Statistik ist die mathematische Studie der Wahrscheinlichkeit, aus einer begrenzten Anzahl von Stichproben oder Beobachtungen auf Merkmale einer Population zu schließen. ___ qstnhdr ___ Warum liefert SciPy negative P-Werte für extrem kleine p-Werte mit dem Fisher-exact Test? ___ answer7504381 ​​___

Fishers exakter Test verwendet die hypergeometrische Verteilung.

Die Version von scipy, die Sie verwenden, verwendet eine Implementierung der hypergeometrischen Verteilung, die nicht sehr präzise ist. Dies ist ein bekanntes Problem und wurde im scipy-Repository behoben.

    
___ tag123scipy ___ SciPy ist eine Open-Source-Bibliothek von Algorithmen und mathematischen Werkzeugen für die Programmiersprache Python. ___ tag123r ___ R ist eine freie, quelloffene Programmiersprache und Softwareumgebung für statistische Berechnungen, Bioinformatik, Visualisierung und allgemeine Datenverarbeitung. Stellen Sie minimale, reproduzierbare, repräsentative Beispiele für Ihre Fragen bereit. Verwenden Sie dput () für Daten und geben Sie alle Nicht-Basis-Pakete mit Bibliotheksaufrufen an. Bilder für Daten oder Code nicht einbetten, eingerückte Codeblöcke verwenden. Verwenden Sie für statistische Fragen http://stats.stackexchange.com. ___
Jeffrey Sax 21.09.2011, 17:56
quelle

Tags und Links