Einfach gesagt, bei der Textklassifizierung geht es darum, einen Text in eine Reihe von (meist vordefinierten) Kategorien zu setzen. Dies ist eines der wichtigsten Probleme, die in vielen realen Anwendungen auftreten. Ein Beispiel für eine Textklassifizierung wäre beispielsweise ein automatisiertes Call-Center, das die Beschwerden automatisch in die am besten geeignete Gruppe von Problemen kategorisieren möchte.
Ich versuche, FeatureUnion zu verwenden, um verschiedene Features aus einer Datenstruktur zu extrahieren, aber es schlägt aufgrund unterschiedlicher Dimensionen fehl: ValueError: blocks[0,:] has incompatible row dimensions
Implementie...
11.09.2014, 19:22
Ich habe ein eindimensionales Array mit großen Strings in jedem der Elemente. Ich versuche ein CountVectorizer zu verwenden, um Textdaten in numerische Vektoren umzuwandeln. Ich erhalte jedoch einen Fehler, der besagt:
%Vor%
mealarray...
14.10.2014, 17:48
Der folgende Code führt Naive Bayes Film Review Classifier aus.
Der Code generiert eine Liste der informativsten Funktionen.
Hinweis: Der Ordner **movie review** befindet sich in nltk .
%Vor%
Link des Codes von alvas
Wie ka...
27.03.2015, 13:34
Ich habe Schwierigkeiten, Random Forest in Python mit Scikit learn zu verwenden. Mein Problem ist, dass ich es für die Textklassifizierung verwende (in 3 Klassen - positiv / negativ / neutral) und die Features, die ich extrahiere, sind hauptsäch...
24.02.2014, 20:13
Ich habe einen großen Korpus von Meinungen (2500) in Rohtext. Ich würde gerne die scikit-learn-Bibliothek verwenden, um sie in Test- / Train-Sets aufzuteilen. Was könnte der beste Ansatz sein, um diese Aufgabe mit scikit-learn zu lösen? Könnte i...
11.09.2014, 17:44