urllib2 gibt 404 für eine Website zurück, die in Browsern angezeigt wird

9

Ich kann mit urllib2 keine bestimmte URL öffnen. Derselbe Ansatz funktioniert gut mit anderen Websites wie "http://www.google.com", nicht jedoch mit dieser Website (die auch im Browser angezeigt wird).

mein einfacher Code:

%Vor%

Kann mir jemand helfen, damit es funktioniert?

Das ist ein Fehler, den ich bekommen habe:

%Vor%

Danke

    
user1652287 06.09.2012, 14:25
quelle

3 Antworten

8

Ich habe es gerade ausprobiert und 404 Code erhalten und zurückgesendet.

Bei einer Vermutung handelt es sich um eine User-Agent-Erkennung, die entweder versehentlich oder absichtlich keinen Inhalt für python urllib bereitstellt.

Klarstellung, mit urllib , ich erhielt die urlopen gab ein Antwortobjekt mit einem 404 Code und HTML Inhalt zurück. Mit urllib2.urlopen wurde eine urllib2.HTTPError Ausnahme ausgelöst.

Ich schlage vor, dass Sie versuchen, Ihren User Agent auf etwas einzustellen, das wie ein Browser aussieht. Hier ist eine Frage dazu: Ändern des Benutzeragenten auf urllib2.urlopen

    
MattH 06.09.2012, 14:42
quelle
3

Sie können try except verwenden, um einen Fehler

zu erfassen %Vor%     
stackFish 14.08.2015 12:13
quelle
0

hm ... Sind Sie sicher, dass die URL gültig ist? Probieren Sie "http://www.google.com" aus. Ich hatte einen ähnlichen Code und es gibt keine Probleme mit urllib. Oder Sie können try-except verwenden, um die Details des Fehlers zu sehen. Und natürlich ist MattHs Antwort der Wahrheit sehr ähnlich :)

    
oleg.foreigner 06.09.2012 20:13
quelle

Tags und Links