scikit-learn

scikit-learn ist eine Machine-Learning-Bibliothek für Python, die einfache und effiziente Werkzeuge für die Datenanalyse und das Data Mining bietet, wobei der Schwerpunkt auf maschinellem Lernen liegt. Es ist für jeden zugänglich und in verschiedenen Kontexten wiederverwendbar. Es basiert auf NumPy und SciPy. Das Projekt ist Open Source und kommerziell nutzbar (BSD-Lizenz).
3
Antworten

Proximitätsmatrix in sklearn.ensemble.RandomForestClassifier

Ich versuche Clustering in Python mit zufälligen Forests durchzuführen. In der R-Implementierung von Random Forests gibt es ein Flag, das Sie festlegen können, um die Näherungsmatrix zu erhalten. Ich kann nichts Ähnliches in der Python Scikit Ve...
09.09.2013, 16:49
1
Antwort

Verwendung eines expliziten (vordefinierten) Validierungssatzes für die Grid-Suche mit sklearn

Ich habe einen Datensatz, der zuvor in drei Sätze unterteilt wurde: Zug, Validierung und Test. Diese Sets müssen verwendet werden, um die Leistung verschiedener Algorithmen zu vergleichen. Ich möchte nun die Parameter meiner SVM mit dem Valid...
11.08.2015, 18:03
1
Antwort

tensorflow: Speichern und Wiederherstellen der Sitzung

Ich versuche, einen Vorschlag aus den Antworten zu implementieren: Tensorflow: Wie wird ein Modell gespeichert / wiederhergestellt? Ich habe ein Objekt, das ein tensorflow -Modell in einem sklearn -Stil umschließt. %Vor% Wenn ich...
28.12.2015, 20:11
2
Antworten

parallele Generierung von zufälligen Gesamtstrukturen mit scikit-learn

Hauptfrage: Wie kombiniere ich verschiedene randomForest in python und scikit-learn? Ich verwende derzeit das randomForest-Paket in R, um Randomforest-Objekte mithilfe von Elastic Map Reduce zu generieren. Dies soll ein Klassifizierungsproble...
18.09.2014, 13:39
4
Antworten

Scikit: Berechnung der Präzision und des Recalls mit der Funktion cross_val_score

Ich benutze Scikit, um eine logistische Regression auf Spam / Ham-Daten durchzuführen. X_train ist meine Trainingsdaten und y_train die Etiketten ('spam' oder 'ham') und ich habe meine LogisticRegression so trainiert: %Vor% Wenn ich die Gena...
08.12.2014, 11:34
3
Antworten

Wie wird ein Datensatz in Trainings- und Validierungsmengen aufgeteilt?

Ich habe ein Klassifikationsproblem mit mehreren Klassen und mein Dataset ist verzerrt, ich habe 100 Instanzen einer bestimmten Klasse und sage 10 einer anderen Klasse. Daher möchte ich mein Dataset-Aufbewahrungsverhältnis zwischen Klassen aufte...
16.03.2015, 16:27
1
Antwort

Topic modeling - Ordnen Sie ein Dokument mit den Top 2 Themen als Kategoriebezeichnung zu - sklearn Latent Dirichlet Allocation

Ich gehe jetzt durch LDA (Latent Dirichlet Allocation) Topic Modeling-Methode, um bei der Extraktion von Themen aus einer Reihe von Dokumenten zu helfen. Wie ich anhand des unten stehenden Links verstanden habe, handelt es sich hierbei um einen...
23.12.2015, 06:09
3
Antworten

Scikit-Learn kann nicht importiert werden

Ich habe versucht, scikit-learn auf meinem Linux Mint 12 zu installieren, aber es ist fehlgeschlagen. Ich habe das Paket von Ссылка heruntergeladen und mit installiert %Vor% Ich habe dann das Verzeichnis in home geändert und die python2.7-...
13.07.2012, 05:07
1
Antwort

Scikit lernen - fit_transform auf dem Test-Set

Ich habe Schwierigkeiten, Random Forest in Python mit Scikit learn zu verwenden. Mein Problem ist, dass ich es für die Textklassifizierung verwende (in 3 Klassen - positiv / negativ / neutral) und die Features, die ich extrahiere, sind hauptsäch...
24.02.2014, 20:13
1
Antwort

So extrahieren Sie Informationen aus dem scikits.learn-Klassifizierer, um sie dann in C-Code zu verwenden

Ich habe eine Reihe von RBF SVMs mit scikits.learn in Python trainiert und dann die Ergebnisse gebeizt. Diese sind für Bildverarbeitungsaufgaben und eine Sache, die ich zum Testen machen möchte, ist jeder Klassifizierer auf jedem Pixel einiger T...
02.12.2011, 17:31