classification, Seitenzahl 4

Im maschinellen Lernen und in der Statistik ist die Klassifizierung das Problem, aus einer Gruppe von Kategorien, zu denen eine neue Beobachtung gehört, auf der Grundlage eines Trainingsdatensatzes zu ermitteln, der Beobachtungen enthält, deren Kategoriezugehörigkeit (Label) bekannt ist.

Antwort

Wie teilt man Daten (Rohtext) in Test / Train-Sets mit dem Scikit-Crossvalidierungsmodul auf?

Ich habe einen großen Korpus von Meinungen (2500) in Rohtext. Ich würde gerne die scikit-learn-Bibliothek verwenden, um sie in Test- / Train-Sets aufzuteilen. Was könnte der beste Ansatz sein, um diese Aufgabe mit scikit-learn zu lösen? Könnte i...

11.09.2014, 17:44

Antworten

Kombinieren von zufälligen Waldmodellen in scikit learn

Ich habe zwei RandomForestClassifier-Modelle und möchte sie zu einem Metamodell kombinieren. Sie wurden beide mit ähnlichen, aber unterschiedlichen Daten trainiert. Wie kann ich das tun? %Vor% Ich möchte big_rf mit allen Bäumen erstellen,...

12.02.2015, 23:11