Ich habe ein eindimensionales Array mit großen Strings in jedem der Elemente. Ich versuche ein CountVectorizer
zu verwenden, um Textdaten in numerische Vektoren umzuwandeln. Ich erhalte jedoch einen Fehler, der besagt:
mealarray
enthält große Strings in jedem der Elemente. Es gibt 5000 solcher Proben. Ich versuche dies wie folgt zu vektorisieren:
Der vollständige Stack-Trace:
%Vor% Überprüfen Sie die Form von mealarray
. Wenn das Argument fit_transform
ist ein Array von Strings, es muss ein eindimensionales Array sein. (Das heißt, mealarray.shape
muss die Form (n,)
haben.) Beispielsweise erhalten Sie den Fehler "kein Attribut", wenn mealarray
eine Form wie (n, 1)
hat.
Sie könnten etwas wie
ausprobieren %Vor%Tags und Links python numpy scikit-learn text-classification