Wie kann ich br und p in Zeilenumbrüche verwandeln?

8

Nehmen wir an, ich habe einen HTML-Code mit <p> und <br> -Tags. Nachher entferne ich den HTML-Code, um die Tags zu bereinigen. Wie kann ich sie in Zeilenumbrüche verwandeln?

Ich benutze Pythons BeautifulSoup Bibliothek, wenn das überhaupt hilft.

    
TIMEX 08.05.2012, 01:10
quelle

4 Antworten

13

Ohne einige Besonderheiten ist es schwer sicher zu sein, dass dies genau das tut, was Sie wollen, aber das sollte Ihnen die Idee geben ... es wird davon ausgegangen, dass Ihre b-Tags in p Elemente eingeschlossen sind.

%Vor%

Dies führt zu ...

%Vor%     
Mike Pennington 08.05.2012 01:42
quelle
3

get_text scheint zu tun, was Sie brauchen

%Vor%     
naoko 09.08.2016 22:12
quelle
1

Dies ist eine python3-Version von @Mike Penningtons Antwort (es hilft wirklich), ich habe einen Wurf-Refactor gemacht.

%Vor%

Um dies zu verwenden, übergeben Sie einfach das Beautifulsoup-Objekt an get_plain_text methond.

%Vor%     
Geng Jiawen 18.10.2015 10:38
quelle
-5

Ich bin mir nicht ganz sicher, was Sie erreichen wollen, aber wenn Sie nur versuchen, die HTML-Elemente zu entfernen, würde ich einfach ein Programm wie Notepad2 und benutze die Funktion" Alle ersetzen ". Ich denke, du kannst auch eine neue Zeile mit" Alle ersetzen "einfügen. Stellen Sie sicher, dass Sie das <p> -Element, das Sie auch das Schließen entfernen, ebenfalls ersetzen ( </p> ). Zusätzlich nur ein FYI der richtige HTML5 ist <br /> anstelle von <br> , aber es ist nicht wirklich wichtig. Python wäre nicht meine erste Wahl dafür, also ist es ein wenig außerhalb meines Wissensbereichs, entschuldige, dass ich nicht mehr helfen konnte.

    
Андрей 08.05.2012 01:42
quelle

Tags und Links