lxml etree.iterparse error "TypeError: Lesen von Dateiobjekten muss einfache Zeichenfolgen zurückgeben"

8

Ich möchte ein HTML-Dokument mit lxml analysieren. Ich benutze Python 3.2.3 und lxml 2.3.4 ( Ссылка )

Ich verwende das etree.iterparse , um das Dokument zu analysieren, aber es gibt den folgenden Laufzeitfehler zurück:

%Vor%

Die Frage ist: Wie löse ich diesen Laufzeitfehler?

Vielen Dank.

Hier ist der Code:

%Vor%     
Ababneh A 20.04.2012, 07:48
quelle

1 Antwort

18

Ihr StringIO-Puffer hat eine Unicode-Zeichenfolge. iterparse arbeitet mit dateiähnlichen Objekten, die Bytes zurückgeben. Der folgende Puffer sollte mit iterparse arbeiten:

%Vor%     
Imran 20.04.2012, 08:03
quelle

Tags und Links