Das Markup muss wohlgeformt sein

7

Zunächst möchte ich sagen, dass ich ein Neuling in SAX und Java bin.

Ich versuche, Informationen aus einer XML-Datei zu lesen, die nicht gut gebildet ist.

Wenn ich versuche, den SAX- oder DOM-Parser zu verwenden, erhalte ich den folgenden Fehler als Antwort:

%Vor%

So richte ich meine XML-Datei ein:

%Vor%

Kann ich das SAX oder DOM zwingen, XML-Dateien zu analysieren, selbst wenn sie nicht gut formatiert sind?

Danke für Ihre Hilfe. Sehr geschätzt. Haythem

    
Haythem 23.03.2010, 11:19
quelle

3 Antworten

18

Am besten ist es, den XML-Code zu formatieren, wahrscheinlich durch Vorverarbeitung. In diesem Fall können Sie dies erreichen, indem Sie einfach eine XML-Deklaration einfügen (und das ist optional) und ein Root-Element (das nicht optional ist) wie folgt bereitstellen:

%Vor%

Dort habe ich willkürlich den Namen "Wrapper" für das Wurzelelement gewählt; es kann sein, was auch immer du magst.

    
T.J. Crowder 23.03.2010, 11:22
quelle
1

Hinweis: Wenn Sie sax oder stax verwenden, können Sie ein nicht korrekt formatiertes xml-Dokument erfolgreich parsen, bis der Fehler FIRST "wohlgeformt" auftritt.

(Ich weiß, dass dies nicht zu viel hilft ...)

    
Yaneeve 23.03.2010 11:39
quelle
0

Da das DOM Ihre XML-Datei scannt und dann eine Baumstruktur erstellt, entspricht der Stammknoten der Baumstruktur der as 1-Antwort. Wenn der Parser das oder gar nicht finden kann, kann er sogar den Baum erstellen. Daher ist es besser, die XML-Datei vor der Verarbeitung durch DOM oder Sax zu bearbeiten.

    
jasonfungsing 23.03.2010 11:41
quelle

Tags und Links