scikit-learn ist eine Machine-Learning-Bibliothek für Python, die einfache und effiziente Werkzeuge für die Datenanalyse und das Data Mining bietet, wobei der Schwerpunkt auf maschinellem Lernen liegt. Es ist für jeden zugänglich und in verschiedenen Kontexten wiederverwendbar. Es basiert auf NumPy und SciPy. Das Projekt ist Open Source und kommerziell nutzbar (BSD-Lizenz).
Ich versuche nur, ein einfaches RandomForestRegressor-Beispiel zu machen. Aber beim Testen der Genauigkeit bekomme ich diesen Fehler
%Vor%
Dies ist das Beispiel der Daten. Ich kann die echten Daten nicht zeigen.
%Vor%
Hier ist mein Code....
Ich möchte alle Spalten auf einem Pandas DataFrame imputieren ... die einzige Möglichkeit, dies zu tun, ist Spalte für Spalte, wie unten gezeigt ...
Gibt es eine Operation, bei der ich den gesamten DataFrame unterstellen kann, ohne die Spalt...
Ich verwende cross_validation von sklearn,
%Vor%
Ich bekomme die folgende Warnung:
cross_validation.py:44: DeprecationWarning: Dieses Modul wurde eingestellt
in der Version 0.18 zugunsten des model_selection Moduls, in das alle
...
Ich möchte 3 kategorische Merkmale von 10 Funktionen in meinen Datensätzen kodieren. Ich verwende preprocessing von sklearn.preprocessing , um Folgendes zu tun:
%Vor%
Ich konnte jedoch nicht fortfahren, da ich diesen Fehler erhalte:
%V...
Ich habe einige geografische Daten analysiert und versucht, das nächste Ereignis in Bezug auf die Zeit und die geographische Position vorherzusagen / vorherzusagen. Die Daten waren in der folgenden Reihenfolge (mit Beispieldaten)
%Vor%
Erste...
NLTK-Paket bietet eine Methode show_most_informative_features() , um die wichtigsten Funktionen für beide Klassen zu finden, mit Ausgabe wie:
%Vor%
Wie in dieser Frage beantwortet Wie Sie am meisten bekommen informative Features für sciki...
Nachdem ich cross_validation.KFold (n, n_folds = falten) benutzt habe, möchte ich auf die Indizes für Training und Testen der einzelnen Falte zugreifen, anstatt alle Falten zu durchlaufen.
Nehmen wir den Beispielcode:
%Vor%
Ich würde gern...
Ich habe ein eindimensionales Array mit großen Strings in jedem der Elemente. Ich versuche ein CountVectorizer zu verwenden, um Textdaten in numerische Vektoren umzuwandeln. Ich erhalte jedoch einen Fehler, der besagt:
%Vor%
mealarray...
Ich verwende Scikit-learn RFECV, um die wichtigsten Merkmale für eine logistische Regression mit einer Kreuzvalidierung auszuwählen. Angenommen, X ist ein [n, x] Datenrahmen von Merkmalen und y repräsentiert die Antwortvariable:
%Vor%
Zwei F...
In der Dokumentation habe ich gelesen, dass ein Dummy-Klassifikator verwendet werden kann Testen Sie es gegen einen Klassifikationsalgorithmus.
Dieser Klassifikator ist nützlich als einfache Vergleichsbasis für andere
(echte) Klassifik...