scikit-learn

scikit-learn ist eine Machine-Learning-Bibliothek für Python, die einfache und effiziente Werkzeuge für die Datenanalyse und das Data Mining bietet, wobei der Schwerpunkt auf maschinellem Lernen liegt. Es ist für jeden zugänglich und in verschiedenen Kontexten wiederverwendbar. Es basiert auf NumPy und SciPy. Das Projekt ist Open Source und kommerziell nutzbar (BSD-Lizenz).
4
Antworten

In sklearn.decomposition.PCA, warum sind components_ negativ?

Ich versuche, mit Abdi & amp; Williams - Hauptkomponentenanalyse (2010) und Hauptkomponenten über SVD mit numpy.linalg.svd . Wenn ich das Attribut components_ von einer angepassten PCA mit anzeigt sklearn, sie haben genau die gleiche...
26.06.2017, 17:53
1
Antwort

python sklearn: Was ist der Unterschied zwischen accuracy_score und learning_curve score?

Ich verwende Python sklearn (Version 0.17), um das ideale Modell für einen Datensatz auszuwählen. Um dies zu tun, habe ich die folgenden Schritte ausgeführt: Teilen Sie den Datensatz mit cross_validation.train_test_split mit test_size =...
06.02.2016, 15:30
1
Antwort

Python scikit exportieren lernen Modelle in Pmml

Ich möchte Python scikit-learn-Modelle in PMML exportieren. Welches Python-Paket ist am besten geeignet? Ich habe über Augustus gelesen, aber ich konnte kein Beispiel mit scikit-learn-Modellen finden.     
19.10.2015, 18:25
1
Antwort

Einige Zweifel, die einige Features für die Bibliothek libsvm / scikit-learn in Python modellieren

Ich habe eine Menge ebay-Titel wie diesen geschabt: %Vor% und ich habe alle auf diese Weise manuell markiert %Vor% wobei B = Marke (Apple) M = Modell (iPhone 5) C = Farbe (Weiß) S = Größe (Größe) NA = Nicht zugewiesen (Dual Core) Jetz...
28.06.2015, 19:51
1
Antwort

Warum ist meine VotingClassifier-Genauigkeit geringer als mein individueller Klassifikator?

Ich versuche ein Ensemble von drei Klassifikatoren (Random Forest, Support Vector Machine und XGBoost) mit dem VotingClassifier () in scikit-learn zu erstellen. Ich finde jedoch, dass die Genauigkeit des Ensembles tatsächlich abnimmt anstatt zuz...
27.09.2016, 09:20
2
Antworten

sklearn: Benutzerdefinierte Kreuzvalidierung für Zeitreihendaten

Ich versuche ein maschinelles Lernproblem zu lösen. Ich habe einen spezifischen Datensatz mit time-series -Element. Für dieses Problem verwende ich die bekannte Python-Bibliothek - sklearn . Es gibt viele Kreuzvalidierungs-Iteratoren in dies...
25.11.2015, 23:20
3
Antworten

Sklearn SVM: SVR und SVC, die für jede Eingabe dieselbe Vorhersage erhalten

Hier ist ein Einfügen des Codes: SVM-Beispielcode Ich habe ein paar andere Antworten auf dieses Problem ausgecheckt ... und es scheint, als ob diese spezifische Iteration des Problems ein bisschen anders ist. Zuallererst sind meine Ein...
26.12.2015, 21:07
1
Antwort

Vergleichen von Computer Vision Bibliotheken in Python [geschlossen]

Ich möchte über eine Python-Computer-Vision-Bibliothek entscheiden. Ich hatte OpenCV in C ++ verwendet und mag es sehr. Allerdings muss ich diesmal meinen Algorithmus in Python entwickeln. Meine kurze Liste hat drei Bibliotheken: 1- OpenCV (Py...
22.05.2013, 16:49
2
Antworten

Effiziente Nächste-Nachbarn-Suche nach dünn besetzten Matrizen

Ich habe ein großes Datenkorpus (Text), das ich in eine spärliche Term-Dokument-Matrix konvertiert habe (ich verwende scipy.sparse.csr.csr_matrix , um eine spärliche Matrix zu speichern). Ich möchte für jedes Dokument die nächsten Nachbarn fin...
10.08.2013, 17:07
1
Antwort

Wie führe ich Cluster mit Gewichten / Dichte in Python aus? Etwas wie Kmeans mit Gewichten?

Meine Daten sind wie folgt: %Vor% Ich möchte in der Lage sein, die Daten in N Cluster zu gruppieren (sagen wir 3). Normalerweise würde ich ein kmeans verwenden: %Vor% Das Problem dabei ist, dass es keine Gewichtung berücksichtigt (in die...
11.07.2017, 03:51