Jsoup: Erhalte alle Überschrift-Tags

7

Ich versuche, ein HTML-Dokument mit Jsoup zu analysieren, um alle Überschriften-Tags zu erhalten. Außerdem muss ich die Überschrift-Tags als [h1] [h2] usw. gruppieren.

%Vor%

aber das gibt mir ein leeres Array.

    
Tropicalista 20.10.2012, 12:06
quelle

2 Antworten

19

Ihr Selektor bedeutet h-Tag mit Attribut "0-6" hier - keine Regex. Sie können jedoch stattdessen mehrere Selektoren kombinieren: hh = doc.select("h0, h1, h2, h3, h4, h5, h6"); .

Gruppierung: benötigen Sie eine Gruppe mit allen h-Tags + eine Gruppe für jedes h1, h2, ... oder nur eine Gruppe für jedes h1, h2, ... tag?

Hier ist ein Beispiel, wie Sie das tun können:

%Vor%

Wenn Sie eine Gruppe für jedes h1, h2, ... Tag haben möchten, können Sie den ersten Selektor löschen und hTags durch doc in den anderen ersetzen.

    
ollo 21.10.2012, 14:10
quelle
2

Verwenden Sie doc.select ("h1, h2, h3, h4, h5, h6") , um alle Überschriften-Tags zu erhalten. Verwenden Sie doc.select ("h1") , um alle diese Tags separat zu erhalten. In Ссылка

sehen Sie, was Sie mit einer Auswahlanweisung tun können     
Sai Sunder 09.02.2014 11:03
quelle

Tags und Links