text-classification

Einfach gesagt, bei der Textklassifizierung geht es darum, einen Text in eine Reihe von (meist vordefinierten) Kategorien zu setzen. Dies ist eines der wichtigsten Probleme, die in vielen realen Anwendungen auftreten. Ein Beispiel für eine Textklassifizierung wäre beispielsweise ein automatisiertes Call-Center, das die Beschwerden automatisch in die am besten geeignete Gruppe von Problemen kategorisieren möchte.
2
Antworten

kann FeatureUnion in scikit-learn aufgrund unterschiedlicher Dimensionen nicht verwenden

Ich versuche, FeatureUnion zu verwenden, um verschiedene Features aus einer Datenstruktur zu extrahieren, aber es schlägt aufgrund unterschiedlicher Dimensionen fehl: ValueError: blocks[0,:] has incompatible row dimensions Implementie...
11.09.2014, 19:22
2
Antworten

CountVectorizer: AttributeError: 'numpy.darray' -Objekt hat kein Attribut 'lower'

Ich habe ein eindimensionales Array mit großen Strings in jedem der Elemente. Ich versuche ein CountVectorizer zu verwenden, um Textdaten in numerische Vektoren umzuwandeln. Ich erhalte jedoch einen Fehler, der besagt: %Vor% mealarray...
14.10.2014, 17:48
2
Antworten

Testen des NLTK-Klassifikators für eine bestimmte Datei

Der folgende Code führt Naive Bayes Film Review Classifier aus. Der Code generiert eine Liste der informativsten Funktionen. Hinweis: Der Ordner **movie review** befindet sich in nltk . %Vor% Link des Codes von alvas Wie ka...
27.03.2015, 13:34
1
Antwort

Scikit lernen - fit_transform auf dem Test-Set

Ich habe Schwierigkeiten, Random Forest in Python mit Scikit learn zu verwenden. Mein Problem ist, dass ich es für die Textklassifizierung verwende (in 3 Klassen - positiv / negativ / neutral) und die Features, die ich extrahiere, sind hauptsäch...
24.02.2014, 20:13
1
Antwort

Wie teilt man Daten (Rohtext) in Test / Train-Sets mit dem Scikit-Crossvalidierungsmodul auf?

Ich habe einen großen Korpus von Meinungen (2500) in Rohtext. Ich würde gerne die scikit-learn-Bibliothek verwenden, um sie in Test- / Train-Sets aufzuteilen. Was könnte der beste Ansatz sein, um diese Aufgabe mit scikit-learn zu lösen? Könnte i...
11.09.2014, 17:44