CountVectorizer: AttributeError: 'numpy.darray' -Objekt hat kein Attribut 'lower'

Question

CountVectorizer: AttributeError: 'numpy.darray' -Objekt hat kein Attribut 'lower'

8

Ich habe ein eindimensionales Array mit großen Strings in jedem der Elemente. Ich versuche ein CountVectorizer zu verwenden, um Textdaten in numerische Vektoren umzuwandeln. Ich erhalte jedoch einen Fehler, der besagt:

%Vor%

mealarray enthält große Strings in jedem der Elemente. Es gibt 5000 solcher Proben. Ich versuche dies wie folgt zu vektorisieren:

%Vor%

Der vollständige Stack-Trace:

%Vor%

python numpy scikit-learn text-classification

ashu 14.10.2014, 17:48

quelle

2 Antworten

Tags und Links python numpy scikit-learn text-classification

Django: Verwenden von Annotate, Count und Distinct in einem Queryset Manuelles Zusammenführen zweier Dateien mit diff

score 11 · Answer 1

Überprüfen Sie die Form von mealarray . Wenn das Argument fit_transform ist ein Array von Strings, es muss ein eindimensionales Array sein. (Das heißt, mealarray.shape muss die Form (n,) haben.) Beispielsweise erhalten Sie den Fehler "kein Attribut", wenn mealarray eine Form wie (n, 1) hat.

Sie könnten etwas wie

ausprobieren %Vor%

score 5 · Answer 2

5

Bekomme die Antwort auf meine Frage. Im Grunde nimmt CountVectorizer Listen (mit String-Inhalt) als Argument und nicht als Array. Das hat mein Problem gelöst.

ashu 14.10.2014 18:57

quelle