Python XML-Analyse von der Website

8

Ich versuche, von einer Website zu analysieren. Ich stecke fest. Ich werde das XML unten zur Verfügung stellen. Es kommt von einer Webiste. Ich habe zwei Fragen. Was ist der beste Weg, um XML von einer Website zu lesen, und dann habe ich Probleme in das XML zu graben, um die Rate zu bekommen, die ich brauche.

Die Zahl, die ich brauche, ist Base: OBS_VALUE 0.12

Was ich bisher habe:

%Vor%

XML-Code von der Website:

%Vor%     
Trying_hard 08.05.2013, 13:20
quelle

2 Antworten

7

Wenn Sie bei xml.dom.minidom bleiben wollten, versuchen Sie dies ...

%Vor%

Wenn Sie jedoch lxml verwenden möchten, verwenden Sie die Lösung für Unterlauf. Außerdem hatte Ihr ursprünglicher Code einige Fehler. Sie haben tatsächlich versucht, die Dokumentvariable zu analysieren, bei der es sich um die Webadresse handelt. Sie mussten das von der Website zurückgegebene XML analysieren, was in Ihrem Beispiel die Variable get_web ist.

    
b10hazard 08.05.2013, 13:52
quelle
3

Sehen Sie sich Ihren Code an:

%Vor%

Ich bin mir nicht sicher, ob das Dokument korrekt ist, es sei denn, Sie möchten http://www.newyorkfed.org/markets/omo/dmm/fftoXML.cfm?type=dailyr , weil Sie das bekommen (die parens-Gruppe in diesem Fall und die nebeneinander aufgeführten Strings werden automatisch verkettet).

Danach machen Sie etwas Arbeit, um get_web zu erstellen, aber Sie verwenden es nicht in der nächsten Zeile. Stattdessen versuchen Sie, Ihre document zu analysieren, die die URL ist ...

Darüber hinaus würde ich vorschlagen, dass Sie ElementTree verwenden, vorzugsweise lxml's ElementTree ( Ссылка ). Auch der ltree-Parser von lxml nimmt ein dateiähnliches Objekt, das ein urllib-Objekt sein kann. Wenn Sie dies getan haben, nachdem Sie den Rest Ihres Dokuments gestrafft haben, können Sie Folgendes tun:

%Vor%     
underrun 08.05.2013 13:39
quelle

Tags und Links