Nehmen wir an, ich habe einen HTML-Code mit <p>
und <br>
-Tags. Nachher entferne ich den HTML-Code, um die Tags zu bereinigen. Wie kann ich sie in Zeilenumbrüche verwandeln?
Ich benutze Pythons BeautifulSoup Bibliothek, wenn das überhaupt hilft.
Ohne einige Besonderheiten ist es schwer sicher zu sein, dass dies genau das tut, was Sie wollen, aber das sollte Ihnen die Idee geben ... es wird davon ausgegangen, dass Ihre b-Tags in p Elemente eingeschlossen sind.
%Vor%Dies führt zu ...
%Vor%Dies ist eine python3-Version von @Mike Penningtons Antwort (es hilft wirklich), ich habe einen Wurf-Refactor gemacht.
%Vor%Um dies zu verwenden, übergeben Sie einfach das Beautifulsoup-Objekt an get_plain_text methond.
%Vor% Ich bin mir nicht ganz sicher, was Sie erreichen wollen, aber wenn Sie nur versuchen, die HTML-Elemente zu entfernen, würde ich einfach ein Programm wie Notepad2 und benutze die Funktion" Alle ersetzen ". Ich denke, du kannst auch eine neue Zeile mit" Alle ersetzen "einfügen. Stellen Sie sicher, dass Sie das <p>
-Element, das Sie auch das Schließen entfernen, ebenfalls ersetzen ( </p>
). Zusätzlich nur ein FYI der richtige HTML5 ist <br />
anstelle von <br>
, aber es ist nicht wirklich wichtig. Python wäre nicht meine erste Wahl dafür, also ist es ein wenig außerhalb meines Wissensbereichs, entschuldige, dass ich nicht mehr helfen konnte.