CountVectorizer: AttributeError: 'numpy.darray' -Objekt hat kein Attribut 'lower'

8

Ich habe ein eindimensionales Array mit großen Strings in jedem der Elemente. Ich versuche ein CountVectorizer zu verwenden, um Textdaten in numerische Vektoren umzuwandeln. Ich erhalte jedoch einen Fehler, der besagt:

%Vor%

mealarray enthält große Strings in jedem der Elemente. Es gibt 5000 solcher Proben. Ich versuche dies wie folgt zu vektorisieren:

%Vor%

Der vollständige Stack-Trace:

%Vor%     
ashu 14.10.2014, 17:48
quelle

2 Antworten

11

Überprüfen Sie die Form von mealarray . Wenn das Argument fit_transform ist ein Array von Strings, es muss ein eindimensionales Array sein. (Das heißt, mealarray.shape muss die Form (n,) haben.) Beispielsweise erhalten Sie den Fehler "kein Attribut", wenn mealarray eine Form wie (n, 1) hat.

Sie könnten etwas wie

ausprobieren %Vor%     
Warren Weckesser 14.10.2014 18:09
quelle
5

Bekomme die Antwort auf meine Frage. Im Grunde nimmt CountVectorizer Listen (mit String-Inhalt) als Argument und nicht als Array. Das hat mein Problem gelöst.

    
ashu 14.10.2014 18:57
quelle