Welche Lösungen gibt es für das Scraping einer Site über SSL für die Verwendung mit .NET?
Mein Anwendungsfall ist, dass ich mich auf einer Partnerwebsite (https) anmelden, durch eine dynamische Hierarchie navigieren und eine komprimierte Berichtsdatei herunterladen muss.
Ich könnte sicherlich andere Screen Scraper verwenden, wenn es keine brauchbaren Optionen in .NET gibt, weder im Framework noch in OSS.
Der Goldstandard für Screen Scraping in .NET ist das HTML Agility Pack .
Wenn Sie Seiten über HTTPS abrufen, versuchen Sie diesen Artikel:
(Wie Sie bereits in anderen Antworten erwähnt haben, sind Sie möglicherweise eher nach Automatisierung als nach screen scraping . In diesem Fall können Sie besser mit WatiN , ein Framework, das ursprünglich für automatisierte Web-Tests entwickelt wurde, aber flexibel genug für das, was Sie wollen)
Ich habe von Leuten gehört, die den Browser in ihrem Programm hosten und mit jQuery scrapen. Scheint großartig für mich, da jQuery großartig für die Suche im DOM ist.
Tags und Links .net ssl https screen-scraping