scikit-learn

scikit-learn ist eine Machine-Learning-Bibliothek für Python, die einfache und effiziente Werkzeuge für die Datenanalyse und das Data Mining bietet, wobei der Schwerpunkt auf maschinellem Lernen liegt. Es ist für jeden zugänglich und in verschiedenen Kontexten wiederverwendbar. Es basiert auf NumPy und SciPy. Das Projekt ist Open Source und kommerziell nutzbar (BSD-Lizenz).
2
Antworten

kann FeatureUnion in scikit-learn aufgrund unterschiedlicher Dimensionen nicht verwenden

Ich versuche, FeatureUnion zu verwenden, um verschiedene Features aus einer Datenstruktur zu extrahieren, aber es schlägt aufgrund unterschiedlicher Dimensionen fehl: ValueError: blocks[0,:] has incompatible row dimensions Implementie...
11.09.2014, 19:22
2
Antworten

Autoregressives Vektormodell mit scikit-learn

Ich versuche, vektorautoregressive (VAR) Modelle unter Verwendung der verallgemeinerten linearen Modellanpassungsverfahren anzupassen, die in scikit-learn enthalten sind. Das lineare Modell hat die Form y = X w , aber die Systemmatrix X h...
19.12.2013, 12:02
1
Antwort

Random Forest Hyperparameter Tuning scikit-learn mit GridSearchCV

Ich versuche zufällige Gesamtstruktur für mein Problem zu verwenden (unten ist ein Beispielcode für Boston-Datasets, nicht für meine Daten). Ich plane, GridSearchCV für das Hyperparameter-Tuning zu verwenden, aber was sollte der Wertebereich...
02.02.2016, 21:41
3
Antworten

Warum verursacht scikit-learn core dumped?

Ich versuche eine einfache lineare Anpassung in scikit-learn auszuführen: %Vor% Als Ergebnis bekomme ich: %Vor% Weiß jemand, was der Grund für dieses Problem ist und wie das Problem gelöst werden kann? P.S. Ich benutze die Version 0....
25.05.2015, 14:17
2
Antworten

Auswahl von random_state für slearn-Algorithmen

Ich verstehe, dass random_state in verschiedenen Sklearn-Algorithmen verwendet wird, um die Verbindung zwischen verschiedenen Prädiktoren (Bäumen) mit demselben metrischen Wert zu trennen (sagen wir zum Beispiel in GradientBoosting ). Aber...
29.09.2014, 10:38
1
Antwort

Verschiedene Versionen von sklearn geben ganz unterschiedliche Trainingsergebnisse

Wir haben unser Sklearn vom alten 0,13-Git auf 0,14.1 aufgerüstet und haben festgestellt, dass sich die Leistung unseres Klassifikators für die logistische Regression ziemlich verändert hat. Die beiden Klassifikatoren, die mit den gleichen Daten...
18.04.2015, 18:46
2
Antworten

Hat TensorFlow eine Kreuzvalidierung für seine Benutzer implementiert?

Ich habe versucht, Hyperparameter (wie Regularisierung zum Beispiel) zu wählen, indem ich Kreuzvalidierung verwende, oder mehrere Initialisierungen von Modellen trainieren und dann das Modell mit der höchsten Genauigkeit der Kreuzvalidierung aus...
02.07.2016, 21:54
1
Antwort

Scikit K - bedeutet Clustering-Leistungsmaß

Ich versuche, ein Clustering mit der K-Means-Methode durchzuführen, aber ich möchte die Leistung meiner Clustering messen. Ich bin kein Experte, aber ich bin begierig, mehr über Clustering zu lernen. Hier ist mein Code: %Vor% Jetzt, da ic...
04.05.2017, 13:55
2
Antworten

Random Forest Classifier-Segmentierungsfehler

Ich habe versucht, den RF-Klassifikator auf einem Datensatz von ~ 50.000 Einträgen mit 20 oder so Etiketten zu betreiben, was meiner Meinung nach in Ordnung sein sollte, aber ich stolpere immer über die folgenden, wenn ich versuche, zu passen .....
27.11.2013, 01:49
1
Antwort

ImportError: Name name check_array kann nicht aus sklearn.utils.validation importiert werden

Wenn ich die Funktion check_array von Modul sklearn.utils.validation importiere, hat es einen Importfehler ( ImportError: cannot import name check_array ) bekommen. Die Tab-Vervollständigung bekam check_arrays , aber ich frage mich, ob...
27.11.2014, 14:33