scikit-learn

scikit-learn ist eine Machine-Learning-Bibliothek für Python, die einfache und effiziente Werkzeuge für die Datenanalyse und das Data Mining bietet, wobei der Schwerpunkt auf maschinellem Lernen liegt. Es ist für jeden zugänglich und in verschiedenen Kontexten wiederverwendbar. Es basiert auf NumPy und SciPy. Das Projekt ist Open Source und kommerziell nutzbar (BSD-Lizenz).
2
Antworten

Wie gebe ich die Regressionsvorhersage aus jedem Baum in einer zufälligen Gesamtstruktur in Python aus? scikit-learn?

Ich bin neu in der Scikit-Learning- und der Random-Forest-Regression und habe mich gefragt, ob es eine einfache Möglichkeit gibt, die Vorhersagen von jedem Baum in einer zufälligen Gesamtstruktur zusätzlich zur kombinierten Vorhersage zu erhalte...
16.12.2013, 16:26
1
Antwort

Python - Scikit findet Variablenbedeutung für kategoriale Variablen

Ich versuche scikit in Python zu lernen, um ein paar verschiedene Klassifikator-Probleme zu lösen (RF, GBM, etc). Neben dem Erstellen von Modellen und Vorhersagen möchte ich eine variable Bedeutung sehen. Ich weiß, dass es eine Möglichkeit gibt,...
19.03.2015, 23:59
1
Antwort

sklearn auc ValueError: Nur eine Klasse in y_true vorhanden

Ich habe google gesucht und den stackoverflow-Beitrag zu diesem Fehler angezeigt. Sie sind nicht meine Fälle. Ich benutze Keras, um ein einfaches neuronales Netzwerk zu trainieren und eine Vorbedingung für den geteilten Testdatensatz zu stell...
18.08.2016, 12:21
1
Antwort

Kann ich Teilparzellen für DecisionTreeClassifier in scikit-learn (und R) erstellen?

Ich habe alten Code mit dem DecisionTreeClassifier von scikit-learn. Ich würde gerne Teilplots basierend auf diesem Klassifikator machen. Alle Beispiele, die ich bisher gesehen habe (z. B. Ссылка ) verwende "GradientBoostingRegressor" als Kl...
14.02.2014, 20:14
1
Antwort

Warum GridSearchCV in scikit-learn so viele Threads erzeugt

Hier ist die pstree -Ausgabe meiner aktuellen GridSearch, ich bin gespannt, welche Prozesse ablaufen und es gibt etwas, was ich noch nicht erklären kann. %Vor% Ich habe Sachen entfernt, die nichts miteinander zu tun haben. Curly-Klammern...
21.09.2017, 18:46
2
Antworten

Effiziente K-Means-Bewertung mit Silhouette-Score in Sklearn

Ich betreibe k-means-Clustering für ~ 1 Million Elemente (die jeweils als ~ 100-Feature-Vektor dargestellt werden). Ich habe das Clustering für verschiedene k durchgeführt und möchte nun die verschiedenen Ergebnisse mit dem in sklearn implementi...
15.05.2014, 19:41
1
Antwort

Extrahieren von Attributen aus Bildern mit Scikit-Image

Ich habe scikit-image verwendet, um Road-Features mit einigem Erfolg zu klassifizieren. Siehe unten: . Ich habe Schwierigkeiten, den nächsten Schritt zu tun, um die Features zu klassifizieren. Nehmen wir an, diese Features befinden sich in d...
11.03.2016, 11:12
1
Antwort

Scikit verstehen lernen Random Forest Speicherbedarf für die Vorhersage

Ich habe einen Satz von 2000 trainierten zufälligen Regressionsbäumen (von scikit lernen, Random Forest Regressor mit n_estimators=1 ). Das parallele Trainieren der Bäume (50 Kerne) auf einem großen Datensatz (~ 100000 * 700000 = 70 GB @ 8-Bit...
01.07.2016, 08:52
1
Antwort

Fehler beim Sci-Kit Lernen SGD Algo - "Array enthält NaN oder unendlich"

Ich bekomme einen Fehler, der besagt "Array enthält NaN oder unendlich". Ich habe meine Daten überprüft und getestet, ob fehlende Werte vorhanden sind und nichts fehlt. Es ist möglich, dass ich falsch interpretiere, was "Array enthält NaN ode...
03.09.2013, 18:20
4
Antworten

Python: Wie man eine Konfusionsmatrix normalisiert?

Ich habe eine Verwechslungsmatrix für meinen Klassifikator mit der Methode confusion_matrix () aus dem sklearn-Paket berechnet. Die diagonalen Elemente der Konfusionsmatrix stellen die Anzahl der Punkte dar, für die das vorhergesagte Label dem w...
04.01.2014, 22:10