Herausziehen von CSS-Attributen aus Inline-Stilen mit BeautifulSoup

8

Ich habe so etwas:

%Vor%

Ich benutze beautifulsoup, um den HTML-Code zu parsen. Ist es da, um die "URL" im CSS-Attribut "Hintergrund" herauszuziehen?

    
thegreyspot 14.02.2012, 03:37
quelle

1 Antwort

9

Du hast ein paar Optionen - schnell und schmutzig oder richtig. Der schnelle und schmutzige Weg (der leicht bricht, wenn das Markup geändert wird) sieht wie

aus %Vor%

Natürlich müssen Sie damit spielen, um es mit mehreren img -Tags zu arbeiten.

Der richtige Weg, da ich mich schrecklich fühlen würde, dass jemand Regex auf eine CSS-Zeichenkette verwendet :), verwendet einen CSS-Parser. cssutils , eine Bibliothek, die ich gerade bei Google gefunden habe und die auf PyPi verfügbar ist, sieht so aus, als könnte sie das machen.

    
Matt Luongo 14.02.2012, 04:18
quelle

Tags und Links