beautifulsoup

Beautiful Soup ist ein Python-Paket zum Parsen von HTML / XML. Die neueste Version dieses Pakets ist Version 4, importiert als bs4.
1
Antwort

BeautifulSoup: Erhalte den Tag-Namen des Elements selbst, nicht seine Kinder

Ich habe den folgenden (vereinfachten) Code, der die folgende Quelle verwendet: %Vor% Ich möchte das Tag von ele bekommen, in diesem Fall "div". Ich scheine jedoch nur das Etikett seiner Kinder zu bekommen. Fehle ich etwas Einfaches? Ich dac...
16.12.2011, 11:41
2
Antworten

Entfernen aller HTML-Tags zusammen mit ihrem Inhalt aus dem Text

Ich frage mich, wie ich alle HTML-Tags zusammen mit ihren Inhalten mit BeautifulSoup löschen kann. Eingabe: %Vor% Ausgabe: %Vor%     
26.08.2013, 21:17
4
Antworten

Python-Bibliothek für jQuery-ähnliche Textextraktion?

Ich habe HTML, das Einträge wie folgt enthält: %Vor% und ich möchte den Text "Blog Entry" (und eine Reihe anderer Attribute, also suche ich nach einer generischen Antwort) extrahieren. In jQuery würde ich machen %Vor% Der nächste, den...
13.12.2010, 07:08
2
Antworten

Beautifulsoup 4: Entfernen Sie das Kommentar-Tag und seinen Inhalt

Die Seite, die ich verschrotte, enthält diese HTML-Codes. Wie entferne ich das Kommentar-Tag <!-- --> zusammen mit seinem Inhalt mit bs4 ? %Vor%     
25.04.2014, 17:34
2
Antworten

BeautifulSoup in Python - Abrufen des n-ten Tags eines Typs

Ich habe einen HTML-Code, der viele <table> s enthält. Ich versuche, die Informationen in der zweiten Tabelle zu bekommen. Gibt es eine Möglichkeit, dies ohne soup.findAll('table') zu tun? Wenn ich soup.findAll('table') verw...
30.12.2012, 22:50
2
Antworten

Parsing der Webseite in Python mit Beautiful Soup

Ich habe Probleme mit den Daten von der Website. Die Website-Quelle ist hier: %Vor% da ist so etwas:    INFORMIEREN SIE SICH FÜR FILM Tytuł ....................................... .....: La mer à boireOcena .................................
27.06.2012, 20:48
3
Antworten

Wie kann ich mit BeautifulSoup auf Namespace-XML-Elemente zugreifen?

Ich habe ein XML-Dokument, das sich so liest: %Vor% Meine Frage ist, wie kann ich mit einer Bibliothek wie BeautifulSoup in Python auf sie zugreifen? xmlDom.web ["Web"]. Insgesamt? funktioniert nicht?     
17.06.2010, 04:40
2
Antworten

passe BeautifulSoups Prettify by tag an

Ich habe mich gefragt, ob es möglich wäre, es so zu machen, dass prettify keine neuen Zeilen für bestimmte Tags erstellt hat. Ich möchte es so einrichten, dass span und a Tags nicht aufgeteilt werden, zum Beispiel: %Vor% unten is...
11.07.2013, 01:00
1
Antwort

Python BeautifulSoup entspricht lxml make_links_absolute

Also hat lxml eine sehr Hand Funktion: make_links_absolute: %Vor% und alle Links in doc sind jetzt absolut. Gibt es in BeautifulSoup ein einfaches Äquivalent oder muss ich es einfach durch URL parse und normalisieren: %Vor%     
17.12.2010, 07:00
2
Antworten

BeautifulSoup Antworten mit Fehler

Ich versuche, meine Füße mit BS nass zu machen. Ich habe versucht, mich durch die Dokumentation zu arbeiten, aber im allerersten Schritt ist mir schon ein Problem begegnet. Das ist mein Code: %Vor% Dies ist die Antwort, die ich bekomme:...
15.07.2014, 21:54