Browsersimulation - Python

8

Ich muss auf ein paar HTML-Seiten über ein Python-Skript zugreifen, das Problem ist, dass ich COOKIE-Funktionalität brauche, daher wird eine einfache HTTP-Anfrage nicht funktionieren.

Irgendwelche Ideen?

    
RadiantHex 02.04.2010, 16:16
quelle

4 Antworten

14

Besuche Mechanisieren . "Stateful programmatic web browsing in Python".
Es behandelt Cookies automatisch.

%Vor%

mechanize macht auch die API urllib2 zugänglich, wobei die Cookie-Behandlung standardmäßig aktiviert ist.

    
Corey Goldberg 02.04.2010, 16:36
quelle
3

Das Modul cookielib bietet Cookie-Behandlung für HTTP-Clients.

  

Das Modul cookielib definiert Klassen für die automatische Behandlung von HTTP-Cookies. Es ist nützlich für den Zugriff auf Websites, die kleine Datenelemente - Cookies - benötigen, die auf dem Client-Computer durch eine HTTP-Antwort von einem Webserver gesetzt und dann in späteren HTTP-Anfragen an den Server zurückgegeben werden.

Die Beispiele im Dokument zeigen, wie Cookies in Verbindung mit urllib :

verarbeitet werden %Vor%     
gimel 02.04.2010 16:30
quelle
2

Hier ist etwas, das Cookies macht und als Bonus eine Authentifizierung für eine Website, die einen Benutzernamen und ein Passwort benötigt.

%Vor%     
Mark Lutton 02.04.2010 16:30
quelle
0

Warum probierst du Dryscrape nicht dafür:

%Vor%

Sie brauchen keine Cookie-Bibliothek, um Cookies zu speichern, installieren Sie einfach Dryscrape und tun Sie es in Ihrem Stil

    
Harry1992 23.11.2017 17:30
quelle

Tags und Links