Wie löse ich einen reCaptcha im Vorfeld mit einem Web Scraper?

9

Ich bin gerade dabei, einen reCaptcha zu lösen. Einer der Vorschläge war eine Methode namens Token Farming.

Es ist beispielsweise möglich, ReCaptcha-Token von einer anderen Site zu farmen und innerhalb von zwei Minuten eines der gezüchteten Tokens auf die Site anzuwenden, die ich zu lösen versuche, indem ich den Code der Site auf der Rückseite ändere.

Leider konnten wir keine weiteren Erklärungen dazu bekommen, wie wir vorgehen sollten, insbesondere den Code auf der Rückseite ändern.

Wenn jemand in der Lage ist, etwas über den Prozess zu erfahren oder zu geben, würde er die Expertise wirklich schätzen.

    
halfer 22.04.2017, 08:39
quelle

1 Antwort

6

Token Farming / Token Harvesting wurde hier ausführlich beschrieben: Ссылка

Der Ansatz für "Token Farming", der in diesem Papier diskutiert wird, basiert auf dem folgenden Mechanismus:

  1. Jedem Benutzer, der eine Site mit recaptcha besucht, wird ein recaptcha-token .
  2. zugewiesen
  3. Dieses Token wird verwendet, um den Benutzer über mehrere Site-Besuche hinweg zu identifizieren und um ihn als legitimen (oder illegitimen) Benutzer zu markieren.
  4. Abhängig von verschiedenen Faktoren wie Alter des Recaptcha-Tokens, Benutzerverhalten und Browserkonfiguration wird dem Benutzer bei jedem Besuch entweder eine der verschiedenen Recaptcha-Versionen oder gar kein Captcha angezeigt.

(mehr Details können hier aus ihrem Code entnommen werden: Ссылка )

Bedeutet, wenn man eine große Anzahl von frischen und sauberen Token für eine Zielseite erstellen und diese für 9 Tage altern lässt (das hat der Artikel herausgefunden), können diese Token für den Zugriff auf einige geschützte Sites verwendet werden ein Recaptcha sehen.

Nach meinem Verständnis muss ein solcher frischer Token als Cookie an die betreffende Seite weitergegeben werden.

Ich erinnere mich jedoch, irgendwo gelesen zu haben, dass Google diese Lücke innerhalb weniger Tage nach dieser Präsentation geschlossen hat

Vermutlich gibt es auch andere, ähnliche Ansätze, die als "Token Farming" bezeichnet werden.

Soweit ich weiß, haben diese Ansätze Schlupflöcher im Re-Captcha-System ausgenutzt und diese Schlupflöcher wurden von Google sehr schnell geschlossen - oft noch bevor die Zeitung oder Präsentation veröffentlicht wurde, da verantwortungsvolle Autoren normalerweise Google im Voraus informieren.

Für Sie ist das höchstwahrscheinlich nur von akademischem Wert oder um etwas über den richtigen Schutz von Captcha-Systemen und Token-basierten Diensten zu lernen.

update

Eine kurze Überprüfung einiger recaptcha-geschützter Sites hat gezeigt, dass das aktuelle System die Cookies jetzt durcheinanderbringt, aber das recaptcha-Token kann in der Recaptcha-Form als zwei versteckte Eingabeelemente mit teilweise anderen Werten und der ID="recaptcha" gefunden werden. Zeichen".

Wenn Sie eine solche Seite mit einem sauberen Browser besuchen, erhalten Sie ein neues Recaptcha-Token, das Sie später bei Bedarf wieder in dasselbe Formular einfügen können. Zumindest ist das die Theorie, es ist sehr wahrscheinlich, dass all die Cookies und einige lang andauernde Dinge in Ihrem Browser Sie davon abhalten werden.

    
rrschmidt 23.04.2017 19:43
quelle