beautifulsoup

Beautiful Soup ist ein Python-Paket zum Parsen von HTML / XML. Die neueste Version dieses Pakets ist Version 4, importiert als bs4.
1
Antwort

python beautifulsoup iframe Dokument HTML-Extrakt

Ich versuche ein bisschen schöne Suppe zu lernen und einige HTML-Daten aus einigen iFrames zu bekommen - aber ich war bisher nicht sehr erfolgreich. Das Parsen des iFrames an sich scheint also kein Problem mit BS4 zu sein, aber ich scheine ni...
12.04.2014, 09:37
1
Antwort

Wie bekomme ich BeautifulSoup 4 um ein selbst schließendes Tag zu respektieren?

Diese Frage bezieht sich nur auf BeautifulSoup4 , was sie von den vorherigen Fragen unterscheidet: Warum verändert BeautifulSoup meine selbstschließenden Elemente? selfClosingTags in BeautifulSoup Da BeautifulStoneSoup weg ist (...
19.02.2013, 15:47
2
Antworten

Wie wird HTML verschönert, damit die Tag-Attribute in einer einzigen Zeile bleiben?

Ich habe dieses kleine Stück Code: %Vor% Die Ausgabe des obigen Snippets ist jetzt: %Vor% Ich würde gerne herausfinden, wie man die Ausgabe formatiert, so dass es stattdessen dies wird: %Vor% Anders gesagt, würde ich gerne HTML-Anwei...
19.12.2017, 02:17
1
Antwort

Laden von riesigen XML-Dateien und Umgang mit MemoryError

Ich habe eine sehr große XML-Datei (20GB um genau zu sein, und ja, ich brauche alles). Wenn ich versuche, die Datei zu laden, erhalte ich diesen Fehler: %Vor% Dies ist der aktuelle Code, den ich habe, um die XML-Datei zu lesen: %Vor% Nun...
17.02.2013, 17:58
2
Antworten

BeautifulSoup: Wie wird der Wert in einem Element durch ein Element-Tag ersetzt?

Sagen Sie, dass ich dieses Stück HTML habe: %Vor% Wie ersetze ich den ersten "Text" durch ein Ankerelement, so wird das Ergebnis: %Vor% Ich möchte im Grunde eine Teilzeichenfolge in einem NavigableString durch ein Tag ersetzen.     
20.04.2012, 01:09
1
Antwort

Herausziehen von CSS-Attributen aus Inline-Stilen mit BeautifulSoup

Ich habe so etwas: %Vor% Ich benutze beautifulsoup, um den HTML-Code zu parsen. Ist es da, um die "URL" im CSS-Attribut "Hintergrund" herauszuziehen?     
14.02.2012, 03:37
2
Antworten

beautifulsoup: Finde das Geschwister des n-ten Elements

Ich habe einen komplexen HTML-DOM-Baum der folgenden Art: %Vor% Ich habe eine Logik, um den innersten Tisch herauszufinden. Aber nachdem ich es gefunden habe, muss ich das nächste Geschwisterelement (h2) bekommen. Gibt es das überhaupt, kann...
10.04.2010, 13:25
1
Antwort

Löschen Sie den ersten untergeordneten Knoten mit BeautifulSoup

%Vor% Hallo alle, Ich versuche, einige Dateien mit BeautifulSoup zu analysieren, um sie etwas zu säubern. Die Funktionalität, die ich will, ist, dass ich die erste Tabelle löschen möchte, die irgendwo innerhalb einer Tabelle ist, zB: %Vor%...
05.12.2014, 15:29
1
Antwort

Weird-Syntaxfehler bei der Verwendung von beautifulsoup.find ()

Das mag völlig offensichtlich sein, aber ich bin ratlos (irgendwie neu für Python, tut mir leid): %Vor% Ich suche das folgende Element auf der Seite: %Vor% Ich bekomme stattdessen diesen Syntaxfehler: %Vor% Die Online-Basisdokumentat...
31.12.2012, 20:48
2
Antworten