scikit-learn, Seitenzahl 9

scikit-learn ist eine Machine-Learning-Bibliothek für Python, die einfache und effiziente Werkzeuge für die Datenanalyse und das Data Mining bietet, wobei der Schwerpunkt auf maschinellem Lernen liegt. Es ist für jeden zugänglich und in verschiedenen Kontexten wiederverwendbar. Es basiert auf NumPy und SciPy. Das Projekt ist Open Source und kommerziell nutzbar (BSD-Lizenz).

Antworten

Wie soll ich maschinellen Lernalgorithmus unterrichten, der Daten mit großen Unverhältnismäßigkeiten von Klassen verwendet? (SVM)

Ich versuche, meinen SVM-Algorithmus mit Daten von Klicks und Conversions von Leuten zu vermitteln, die die Banner sehen. Das Hauptproblem ist, dass die Klicks etwa 0,2% aller Daten ausmachen, also ist es ein großes Missverhältnis. Wenn ich einf...

06.08.2013, 10:49

Antworten

Wie macht man mit scikit-learn eine Gaußsche / Polynomische Regression?

Bietet scikit-learn die Möglichkeit, eine Regression mit einem Gauß- oder Polynomkern durchzuführen? Ich schaute auf die APIs und ich sehe keine. Hat jemand ein Paket über scikit-learn gebaut, das das macht?

09.12.2013, 04:34

Antwort

Unter Verwendung von Kosinus-Distanz mit scikit learn KNeighborsClassifier

Ist es möglich, so etwas wie 1 - Kosinusähnlichkeit mit dem KNeighborsClassifier von scikit learn zu verwenden? This Antwort sagt nein, aber auf der Dokumentation für KNeighborsClassifier heißt es Metriken, die in DistanceMetrics.html e...

07.12.2015, 22:36

Antwort

Plotting Entscheidungsgrenze der logistischen Regression

Ich führe eine logistische Regression durch. Ich habe es geschafft, Wahrscheinlichkeiten daraus zu ziehen, und bin in der Lage, eine 2-Klassen-Klassifizierungsaufgabe vorherzusagen. Meine Frage ist: Für mein endgültiges Modell habe ich Gew...

31.01.2015, 20:13

Antworten

Clusterpunkte nach KMeans Clustering (scikit learn)

Ich habe Clustering mit Kmeans mit sklearn gemacht. Während es eine Methode hat, um die Zentroide zu drucken, finde ich es ziemlich bizzar, dass scikit-learn keine Methode hat, die Clusterpunkte jedes Clusters auszudrucken (oder dass ich es bish...

26.08.2015, 16:36

Antwort

Wo sollte freeze_support () in ein Python-Skript geschrieben werden?

Ich bin verwirrt über die Verwendung von freeze_support() für multiprocessing und ich bekomme ein Runtime Error ohne es. Ich führe nur ein Skript aus und definiere keine Funktion oder ein Modul. Kann ich es noch benutzen? Oder die Paket...

23.06.2014, 19:58

Antwort

Batch Gradientenabstieg mit scikit learn (sklearn)

Ich spiele mit einem Logistic Regression-Klassifikator, der mit Scikit-Learn (sklearn) arbeitet. Ich habe einen großen Datensatz, der zu langsam ist, um alle auf einmal auszuführen; Außerdem möchte ich die Lernkurve während des Trainings studier...

23.02.2013, 03:13

Antwort

Scikit-Lern Logischer Regressionsspeicherfehler

Ich versuche, das LogisticRegression-Objekt von sklearn 0.11 zu verwenden, um ein Modell an 200.000 Beobachtungen mit etwa 80.000 Merkmalen anzupassen. Ziel ist es, kurze Textbeschreibungen in 1 von 800 Klassen einzuteilen. Wenn ich versuche,...

25.06.2012, 18:47

Antwort

Wie teilt man Daten (Rohtext) in Test / Train-Sets mit dem Scikit-Crossvalidierungsmodul auf?

Ich habe einen großen Korpus von Meinungen (2500) in Rohtext. Ich würde gerne die scikit-learn-Bibliothek verwenden, um sie in Test- / Train-Sets aufzuteilen. Was könnte der beste Ansatz sein, um diese Aufgabe mit scikit-learn zu lösen? Könnte i...

11.09.2014, 17:44

Antwort

Arrays, die als Indizes verwendet werden, müssen vom Typ integer (oder boolean) sein

Fehler sind wie folgt: %Vor% Codes sind wie folgt: %Vor% Ich verwende scikit-learn Paket, X-train , y_train sind im LIBSVM Format, X ist das Feature: Wert-Paar, y_train ist das Ziel / Label, X_train ist im CSR-Format , d...

30.06.2013, 19:18