lxml

lxml ist eine leistungsstarke Python-Bibliothek für die Verarbeitung von XML und HTML.
1
Antwort

ImportError in Google App Engine mit lxml

Ich verwende lxml, um die Seiten zu analysieren. Wenn ich meinen Code mit der App Engine sdk ausführe, funktioniert es, aber wenn ich meine Anwendung in der Cloud ausliege, bekomme ich hier eine Nachricht:    Traceback (zuletzt letzter Aufruf...
21.01.2012, 07:47
2
Antworten

Wie behalte ich Namespace-Informationen bei der Analyse von HTML mit lxml?

%Vor% Beachten Sie, wie sich das Tag von <fb:like> in einfach <like> verwandelt. Dies macht die Verarbeitung von Seiten, die XFBML mit lxml enthalten, viel schwieriger. (Das Gleiche passiert mit <g:plusone></g:plu...
06.07.2011, 13:34
1
Antwort

Wie werden Attribute in python beim Prettyprinting von xml eingezogen?

Angenommen, ich habe XML wie folgt: %Vor% Der erste Elementname mit all seinen Attributen erscheint in einer Zeile. Ich habe gesehen, wie man den Elementbaum mit Hilfe von lxml mit Code wie diesem hübsch bedruckt: %Vor% ... aber damit...
13.10.2012, 17:56
4
Antworten

XPath-Prädikat mit Unterpfaden mit lxml?

Ich versuche zu verstehen und XPath, das mir für die Verwendung mit ACORD XML-Formularen (allgemeines Format in der Versicherung) gesendet wurde. Der XPath, den sie mir gesendet haben, ist (aus Platzgründen verkürzt): %Vor% Wo ich Probleme h...
02.06.2011, 17:40
2
Antworten

Probleme beim Installieren von lxml in Ubuntu

Ich erhalte die folgenden Fehler: pip install lxml %Vor% Ich habe es schon versucht: sudo apt-get install zlib1g-dev vor "pip install" beim Lesen dieser Antwort: Nicht Kann lxml verison 3.3.5 in ubuntu installieren hat abe...
16.07.2015, 19:32
4
Antworten

Python-Web-Scraping mit HTML-Tags mit Attributen

Ich versuche, einen Web-Scraper zu erstellen, der eine Webseite mit Publikationen analysiert und die Autoren extrahiert. Die Skelettstruktur der Webseite ist die folgende: %Vor% Ich habe bisher versucht, BeautifulSoup und lxml zu benutzen, u...
08.09.2009, 02:23
2
Antworten

HTML-Codierung und lxml-Analyse

Ich versuche, endlich einige Probleme mit der Codierung zu lösen, die beim Versuch, HTML mit lxml zu scrappen, auftauchen. Hier sind drei Beispiel-HTML-Dokumente, denen ich begegnet bin: 1. %Vor% 2. %Vor% 3. %Vor% Mein grundlegend...
08.03.2013, 19:50