PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Google Captcha umgehen?



Rüdiger
09.02.2012, 14:52
Hallo liebe Community!

Ich hab da mal eine Frage zum Captcha von Google, der kommt, wenn man zu viel/oft "googelt".

Ich habe vor paar Tagen angefangen, ein kleines Tool zu coden, dass möglichst viele Links von Google in einer Liste speichert. Jedoch funktioniert das ganze immer nur ein paar Seiten lang...

Der Grund dazu ist, dass dann ein Captcha von Seitens Google kommt, der mir das ganze ziemlich erschwert.
Ich habe es über die Google API versucht, jedoch habe ich da das gleiche Problem.

Hat da jemand eine Idee wie ich das umgehen kann, ohne Proxys zu verwenden.

Oder hat jemand eine genauere Ahnung, wann genau der Captcha auftaucht? Nach wie vielen Google versuchen etc. ?

Bin um eure Hilfe sehr Dankbar! :)

H4x0r007
09.02.2012, 15:09
Sendest du einen kompletten HTTP-Header? Also auch mit User-Agent, Accept-Encoding usw? Nimmst du Cookies an?

Da beim "normalen" Surfen ja auch keine Captcha-Meldung erscheint, kann ich mir vorstellen, dass es von der Geschwindigkeit der Aufrufe und dem HTTP-Header abhängt. Füge doch mal einen Delay von 1-2s zwischen jeder Abfrage ein (nach Möglichkeit mit Random-Delay).

RainerKunze
09.02.2012, 16:22
Hallo,

also dieser google-Captcha tritt bei mir ein wenn ich Tor nutze. Ansonsten ist mir noch nie ein Captcha aufgefallen.

Irgendwie müssen die sich ja vor spammartigen Anfragen schützen.

Wieviele Anfragen sendest du denn an Google?

Hu5eL
09.02.2012, 16:45
Auch wenn du "normal" Surft kommt dieses Captcha. Also reicht es nicht einfach einen vollständigen Header zu senden.

HowTo:
Gebt einen Suchbegriff ein und kilckt euch mti einem Delay von ~ 3 Sekunden immer eine Seite weiter. So um ~25 will google dann ein Captcha.

Edit: Ok diesmal bei Seite 45

Freak1936
09.02.2012, 16:52
Ich würde auch mal darauf tippen das du die "Requests" einfach zu schnell abfeuerst, d sollte eine kleine zufällige Verzögerung weiterhelfen, evtl. noch Daten von hidden fields parsen und mit schicken ...

energy
12.02.2012, 12:13
man kann auch http://captchatrader.com/
oder ein vergleichbaren service benutzen.

ReiDC0Re
12.02.2012, 12:30
Stichwort: Delay

Google Captcha konnte man mal mit der eigenen Google Text erkennung umgehen. Geht aber nichtmehr.

Spongshga
12.02.2012, 12:52
Versuchs mal hier mit http://www.antirecaptcha.com/

N-Game
12.02.2012, 14:14
Google ist da sehr sensibel was Daten abgreifen angeht. Deswegen haben z.B. seomoz und Co. im Sinne der Suchmaschinenoptimierung eigene Bots geschrieben, die den Googlebot nachempfinden.
Wenn es nicht unbedingt nötig ist, dass die Links von Google kommen, würde ich alternative Suchmaschinen ausprobieren, die haben oft APIs.