Hier ist der Code, den ich habe:
%Vor%Das Ergebnis ist:
%Vor%Wenn ich jemals einen Crawler entworfen habe, um mir Titel von Websites zu beschaffen, könnte ich am Ende so etwas wie einen Titel für die Website finden.
Meine Frage ist, wie limitiere ich findall
auf ein einziges <title></title>
?
Verwenden Sie re.search
anstelle von re.findall
, wenn Sie nur eine Übereinstimmung wünschen:
Wenn Sie alle Tags haben wollten, dann sollten Sie es als nicht gierig (dh - .*?
) betrachten:
Aber denken Sie daran, BeautifulSoup oder lxml oder ähnliches zu verwenden, um HTML zu parsen.
Verwenden Sie stattdessen eine nicht-gierige Suche:
%Vor%Das Fragezeichen besagt, dass so wenig Zeichen wie möglich übereinstimmen. Nun wird Ihr findall () jedes der von Ihnen gewünschten Ergebnisse zurückgeben.
Tags und Links python regex python-2.7 findall