scikit-learn

scikit-learn ist eine Machine-Learning-Bibliothek für Python, die einfache und effiziente Werkzeuge für die Datenanalyse und das Data Mining bietet, wobei der Schwerpunkt auf maschinellem Lernen liegt. Es ist für jeden zugänglich und in verschiedenen Kontexten wiederverwendbar. Es basiert auf NumPy und SciPy. Das Projekt ist Open Source und kommerziell nutzbar (BSD-Lizenz).
2
Antworten

Dauerhafter Fehler wird in RandomForestRegressor nicht unterstützt

Ich versuche nur, ein einfaches RandomForestRegressor-Beispiel zu machen. Aber beim Testen der Genauigkeit bekomme ich diesen Fehler %Vor% Dies ist das Beispiel der Daten. Ich kann die echten Daten nicht zeigen. %Vor% Hier ist mein Code....
19.09.2015, 05:44
1
Antwort

Beschreiben Sie den gesamten Datenrahmen (alle Spalten) mit Scikit-learn (sklearn), ohne über die Spalten zu iterieren

Ich möchte alle Spalten auf einem Pandas DataFrame imputieren ... die einzige Möglichkeit, dies zu tun, ist Spalte für Spalte, wie unten gezeigt ... Gibt es eine Operation, bei der ich den gesamten DataFrame unterstellen kann, ohne die Spalt...
11.11.2015, 22:12
1
Antwort

Verfallswarnungen von sklearn

Ich verwende cross_validation von sklearn, %Vor% Ich bekomme die folgende Warnung:    cross_validation.py:44: DeprecationWarning: Dieses Modul wurde eingestellt   in der Version 0.18 zugunsten des model_selection Moduls, in das alle   ...
09.04.2017, 02:28
5
Antworten

Problem mit dem OneHotEncoder für kategoriale Funktionen

Ich möchte 3 kategorische Merkmale von 10 Funktionen in meinen Datensätzen kodieren. Ich verwende preprocessing von sklearn.preprocessing , um Folgendes zu tun: %Vor% Ich konnte jedoch nicht fortfahren, da ich diesen Fehler erhalte: %V...
24.04.2017, 12:56
1
Antwort

Wie prognostiziert man in Python mit maschinellem Lernen aus einer gegebenen Menge geografischer Daten?

Ich habe einige geografische Daten analysiert und versucht, das nächste Ereignis in Bezug auf die Zeit und die geographische Position vorherzusagen / vorherzusagen. Die Daten waren in der folgenden Reihenfolge (mit Beispieldaten) %Vor% Erste...
28.01.2013, 13:00
2
Antworten

Wie erhalten Sie die meisten informativen Funktionen für den scikit-learn Klassifikator für verschiedene Klassen?

NLTK-Paket bietet eine Methode show_most_informative_features() , um die wichtigsten Funktionen für beide Klassen zu finden, mit Ausgabe wie: %Vor% Wie in dieser Frage beantwortet Wie Sie am meisten bekommen informative Features für sciki...
17.11.2014, 15:44
1
Antwort

sklearn Kfold ist nicht für die Schleife, sondern für die Einzelfaltung

Nachdem ich cross_validation.KFold (n, n_folds = falten) benutzt habe, möchte ich auf die Indizes für Training und Testen der einzelnen Falte zugreifen, anstatt alle Falten zu durchlaufen. Nehmen wir den Beispielcode: %Vor% Ich würde gern...
09.12.2014, 13:54
2
Antworten

CountVectorizer: AttributeError: 'numpy.darray' -Objekt hat kein Attribut 'lower'

Ich habe ein eindimensionales Array mit großen Strings in jedem der Elemente. Ich versuche ein CountVectorizer zu verwenden, um Textdaten in numerische Vektoren umzuwandeln. Ich erhalte jedoch einen Fehler, der besagt: %Vor% mealarray...
14.10.2014, 17:48
2
Antworten

Scikit-lernen - Feature-Reduktion mit RFECV und GridSearch. Wo sind die Koeffizienten gespeichert?

Ich verwende Scikit-learn RFECV, um die wichtigsten Merkmale für eine logistische Regression mit einer Kreuzvalidierung auszuwählen. Angenommen, X ist ein [n, x] Datenrahmen von Merkmalen und y repräsentiert die Antwortvariable: %Vor% Zwei F...
25.06.2015, 19:27
2
Antworten

Was ist die theoretische Grundlage für den Dummy-Klassifikator scikit-learn?

In der Dokumentation habe ich gelesen, dass ein Dummy-Klassifikator verwendet werden kann Testen Sie es gegen einen Klassifikationsalgorithmus.    Dieser Klassifikator ist nützlich als einfache Vergleichsbasis für andere   (echte) Klassifik...
04.04.2015, 02:00