Beim HTML-Parsing wird eine Serialisierung eines HTML-Dokuments konsumiert und eine Repräsentation erstellt, mit der Sie programmatisch arbeiten können, z. B. um zusätzliche Daten zu erhalten. Die HTML-Spezifikation definiert einen Standardalgorithmus zum Parsen von HTML, der in allen gängigen Browsern implementiert ist.
Ich möchte das HTML-Agility-Pack verwenden, um Bild- und href-Links von einer HTML-Seite zu analysieren, aber ich weiß einfach nicht viel über XML oder XPath. Obwohl ich in vielen Websites nach Hilfedokumenten gesucht habe, kann ich ' Ich benutz...
29.01.2011, 08:23
Ich möchte den Inhalt einer Seite erhalten und die spezifischen Teile daraus extrahieren. Soweit ich weiß, gibt es mindestens zwei Lösungen für diese Aufgabe: Crawler4j und Jsoup .
Beide können den Inhalt einer Seite abrufen und Unterabsch...
19.01.2016, 22:55
Was wäre der einfachste Weg, um den Titel einer Seite in Requests zu bekommen?
%Vor%
08.11.2014, 00:50