Ich versuche, ein HTML-Dokument mit Jsoup zu analysieren, um alle Überschriften-Tags zu erhalten. Außerdem muss ich die Überschrift-Tags als [h1] [h2] usw. gruppieren.
%Vor%aber das gibt mir ein leeres Array.
Ihr Selektor bedeutet h-Tag mit Attribut "0-6" hier - keine Regex. Sie können jedoch stattdessen mehrere Selektoren kombinieren: hh = doc.select("h0, h1, h2, h3, h4, h5, h6");
.
Gruppierung: benötigen Sie eine Gruppe mit allen h-Tags + eine Gruppe für jedes h1, h2, ... oder nur eine Gruppe für jedes h1, h2, ... tag?
Hier ist ein Beispiel, wie Sie das tun können:
%Vor% Wenn Sie eine Gruppe für jedes h1, h2, ... Tag haben möchten, können Sie den ersten Selektor löschen und hTags
durch doc
in den anderen ersetzen.
Verwenden Sie doc.select ("h1, h2, h3, h4, h5, h6") , um alle Überschriften-Tags zu erhalten. Verwenden Sie doc.select ("h1") , um alle diese Tags separat zu erhalten. In Ссылка
sehen Sie, was Sie mit einer Auswahlanweisung tun können