scikit-learn

scikit-learn ist eine Machine-Learning-Bibliothek für Python, die einfache und effiziente Werkzeuge für die Datenanalyse und das Data Mining bietet, wobei der Schwerpunkt auf maschinellem Lernen liegt. Es ist für jeden zugänglich und in verschiedenen Kontexten wiederverwendbar. Es basiert auf NumPy und SciPy. Das Projekt ist Open Source und kommerziell nutzbar (BSD-Lizenz).
1
Antwort

Wie interpretiere ich LDA-Komponenten (mit sklearn)?

Ich habe Latent Dirichlet Allocation ( sklearn Implementierung) verwendet, um etwa 500 wissenschaftliche Artikel-Abstracts zu analysieren und ich habe Themen mit den wichtigsten Wörtern (in deutscher Sprache). Mein Problem besteht darin, dies...
01.02.2016, 20:53
3
Antworten

.arff Dateien mit scikit-learn?

Ich würde gerne ein Attribut-Relation-Dateiformat mit scikit-learn verwenden eine NLP Aufgabe zu erledigen, ist das möglich? Wie kann eine Datei .arff mit scikit-learn ? verwendet werden     
03.12.2014, 05:38
3
Antworten

Schnellste paarweise Entfernungsmetrik in Python

Ich habe ein 1D-Array von Zahlen und möchte alle paarweisen euklidischen Abstände berechnen. Ich habe eine Methode (dank SO), dies mit dem Rundfunk zu tun, aber es ist ineffizient, weil es jede Entfernung zweimal berechnet. Und es skaliert nicht...
29.11.2013, 03:40
3
Antworten

Halten Sie die gleiche Dummy-Variable in Trainings- und Testdaten

Ich baue ein Vorhersagemodell in Python mit zwei separaten Trainings- und Test-Sets. Die Trainingsdaten enthalten numerische kategoriale Variablen, z. B. Postleitzahl, [91521,23151,12355, ...], und auch string-kategorische Variablen, z. B. city...
26.12.2016, 19:54
2
Antworten

Wie kann man die False-Positive-Rate einer linearen SVM korrigieren?

Ich bin ein SVM-Neuling und das ist mein Anwendungsfall: Ich habe viele unsymmetrische Daten, die mit einer linearen SVM binär klassifiziert werden sollen. Ich muss die Rate falscher positiver Werte auf bestimmte Werte festlegen und die entsprec...
29.01.2014, 02:23
4
Antworten

Matrixvervollständigung in Python

Sagen wir, ich habe eine Matrix: %Vor% Und dass ich mit np.NaN , z. B.: , ein paar Löcher in ihn bohre %Vor% Ich möchte die nan -Einträge unter Verwendung von Informationen aus den übrigen Einträgen der Matrix ausfüllen. Ein Beispiel...
31.07.2013, 23:47
1
Antwort

Log-Verlust-Ausgabe ist größer als 1

Ich habe mehrere Modelle für die binäre Klassifizierung von Dokumenten im Bereich Betrug vorbereitet. Ich habe den Log-Verlust für alle Modelle berechnet. Ich dachte, es würde im Wesentlichen die Zuverlässigkeit der Vorhersagen messen und der Lo...
26.01.2016, 12:25
3
Antworten

stemming Unterstützung für CountVectorizer (sklearn) hinzufügen

Ich versuche, meine Pipeline in NLP mit sklearn zu stemming hinzuzufügen. %Vor% Wenn diese Pipeline mit dem CountVectorizer von sklearn verwendet wird, funktioniert es. Und wenn ich die Funktionen manuell erstelle, funktioniert das auch....
23.03.2016, 15:37
5
Antworten

Sklearn set_params benötigt genau 1 Argument?

Ich versuche SkLearn Bayes-Klassifizierung zu verwenden . %Vor% Aber ich verstehe: %Vor% Jetzt versuche ich diesen Code zu verwenden: %Vor% Und holen: %Vor% Ist der Parametername oder -wert falsch?     
25.11.2014, 09:18
4
Antworten

Wie werden Rasterwerte von GridSearchCV grafisch dargestellt?

Ich bin auf der Suche nach einer Möglichkeit, grid_scores_ von GridSearchCV in sklearn zu zeichnen. In diesem Beispiel versuche ich, nach den besten Gamma- und C-Parametern für einen SVR-Algorithmus zu suchen. Mein Code sieht folgendermaßen aus:...
11.05.2016, 11:41