jsoup

Java-HTML-Parser zum Extrahieren und Bearbeiten von HTML-Daten unter Verwendung der besten DOM-, CSS- und jquery-ähnlichen Methoden.
3
Antworten

JSoup analysiert ungültiges HTML mit nicht geschlossenen Tags

Unter Verwendung von JSoup einschließlich der letzten Version 1.7.2 gibt es einen Bug, der ungültiges HTML mit nicht geschlossenen Tags analysiert. Beispiel: %Vor% Das Dokument, das erzeugt wird, ist: %Vor% Die Browser würden etwa...
04.04.2013, 14:17
1
Antwort

jsoup Whitelist entspannter Modus zu streng für Wysiwyg Editor

Ich versuche, jsoup zu verwenden, um das HTML zu bereinigen, das von einem wysiwyg in meinem Klienten bekannt gegeben wird (ynymce, wie es geschieht) Der entspannte Modus scheint nicht entspannt genug zu sein, da er standardmäßig Überspannung...
09.02.2012, 14:59
1
Antwort

Jsoup http Fehler beim Abrufen der URL

Ich lade nur die neueste Version von jsoup (1.7.1) herunter und folge dem offiziellen Code (ändere die URL). Dann habe ich "http Fehler beim Abrufen von URL" %Vor% Was ist das Problem meines Codes? Es scheint, dass der Fehler gerade in And...
26.11.2012, 03:55
1
Antwort

Jsoup - Howto sauber html durch entkommen nicht das unerwünschte html löschen?

Gibt es eine Möglichkeit, jsoup zu erhalten, um eine Zeichenfolge mit HTML zu bereinigen, indem Sie die unerwünschte HTML-Datei umgehen, anstatt sie vollständig zu entfernen? Mein Beispiel: %Vor% Dies ergibt eine "saubere" Zeichenfolge von:...
13.10.2011, 15:36
1
Antwort

Jsoup holt eine Teilseite

Ich versuche, den Inhalt von Bietwebseiten abzuschaben, kann aber nicht die komplette Seite der Website abrufen. Ich verwende Crowbar auf Xulrunner, um die Seite zuerst zu holen (da Ajax bestimmte Elemente auf faule Art lädt) und dann aus der Da...
16.06.2011, 06:43
1
Antwort

Wie bekomme ich direkte Verbindung von Remote-Video von eingebetteter URL in eine URL in Android mit JSoup?

Ich hatte zuvor die Frage gestellt, wie die eingebettete URL für eine Videodatei abgerufen werden kann und erfolgreich durchgeführt wurde. Jetzt habe ich ein anderes Problem. Die JSON-Antwort für eine WU-API-Webcam-Antwort gibt folgende URL:...
29.11.2016, 05:44
5
Antworten

Entfernen Sie leere Tag-Paare aus dem HTML-Fragment

Ich habe eine vom Benutzer gesendete Zeichenfolge, die HTML-Inhalt enthält, z. B. %Vor% Ich möchte diese Zeichenfolge so transformieren, dass leere Tag-Paare entfernt werden (aber leere Tags wie <br/> werden beibehalten). Das Ergebn...
03.01.2012, 10:44
3
Antworten

Jsoup wählt Text nach Tag aus

Ich möchte nach jedem Tag einen Text mit jsoup extrahieren. Gibt es eine Möglichkeit, es direkt auszuwählen oder muss ich .substring auf das Ganze durchführen? %Vor%     
25.04.2013, 15:39
2
Antworten

Jsoup: Erhalte alle Überschrift-Tags

Ich versuche, ein HTML-Dokument mit Jsoup zu analysieren, um alle Überschriften-Tags zu erhalten. Außerdem muss ich die Überschrift-Tags als [h1] [h2] usw. gruppieren. %Vor% aber das gibt mir ein leeres Array.     
20.10.2012, 12:06
1
Antwort

Crawler4j vs. Jsoup für die Seiten Crawlen und Parsen in Java

Ich möchte den Inhalt einer Seite erhalten und die spezifischen Teile daraus extrahieren. Soweit ich weiß, gibt es mindestens zwei Lösungen für diese Aufgabe: Crawler4j und Jsoup . Beide können den Inhalt einer Seite abrufen und Unterabsch...
19.01.2016, 22:55