Berechne Statistiken für Arrays

8

Ich baue eine Web-App, die Statistiken zu einem Datensatz berechnen muss. Ich muss Perzentile, Mittelwerte, Modi und andere statistische Funktionen auf Arrays berechnen.

Normalerweise würde ich in Python nur scipy, numpy oder nltk verwenden, die eine riesige Bibliothek von stat-Array-Funktionen haben. Gibt es Ruby-Edelsteine ​​oder Bibliotheken, die ich dafür nutzen kann?

Falls es keine vorhandenen Bibliotheken gibt, gibt es eine einfache Möglichkeit, meine Datenverarbeitung in Python zu erledigen, während meine App in Ruby / Rails bleibt?

    
slykat 26.11.2012, 07:06
quelle

6 Antworten

7

Wenn Sie wirklich eine vollständige Statistikbibliothek benötigen, sehen Sie sich statample an. Sonst finden Sie deskriptive_statistics eine schöne, leichte Alternative.

    
Ezekiel Templin 26.11.2012, 07:16
quelle
1

Sie können möglicherweise Rubystats oder Easystats . Ich bin mir sicher, dass da draußen mehr Edelsteine ​​sind, von denen ich nichts weiß.

    
Amadan 26.11.2012 07:14
quelle
0

Wenn Sie Statistiken zu ActiveRecord-Modellen berechnen, sollten Sie sich die Statistik ansehen.

>

Ich habe auch statisticus mit einem Lesezeichen versehen, das GNU-R-Integration und SIRB für den Einsatz in der Konsole.

Es gibt unzählige Möglichkeiten, Python unter einer Rails-App auszuführen, aber es ist wahrscheinlich einfacher, die benötigten Methoden in einer Ruby-Bibliothek zu finden.

    
RobinGower 26.11.2012 17:03
quelle
0

Ich habe einen neuen Gem - MDArray implementiert, der Statistiken in JRuby erstellt. Dies kann für eine Web-App eigentlich ziemlich gut sein, da JRuby im Grunde Java ist. MDArray folgt NArray und Numpy Philosophie und obwohl es zu diesem Zeitpunkt wahrscheinlich langsamer als beide ist, sollte es schneller als eine reine Ruby-Alternative sein.

Sieh es dir an und wenn du Hilfe brauchst, werde ich mich freuen zu helfen.

Prost,

Rodrigo

    
Rodrigo Botafogo 28.05.2013 14:57
quelle
0

Sie können NMatrix verwenden, eine numerische Bibliothek, die NumPy in ständiger Entwicklung ähnelt. (Disclaimer: Ich komme vom SciRuby / NMatrix-Team)

    
agarie 19.04.2014 00:36
quelle
0

Für numbercrunching Narray ist die Standardempfehlung. Die statistischen Methoden sind Summation, Kumulative Summation, Produkt (Elemente multiplizieren), Kumulatives Produkt, Mittelwert, Standardabweichung, quadratischer Mittelwert, mittlere quadratische Abweichung, Minimum, Maximum und Median.

Als Spezialist für Zahlen ist beansprucht bis zu 50-mal schneller und speichereffizienter als Array.

    
steenslag 26.11.2012 16:50
quelle

Tags und Links