воскресенье, 2 декабря 2007 г.

Я - НЕ робот или метод обхода капчи Яндекса.

Кто парсит серп Яндекса или массово проверяет наличие ссылки в выдаче(например, посредством «YAP-а»), тот не раз сталкивался вот с такой картинкой:


Я – не исключение.

Экспериментируя, я нашёл решение, которое позволяет «обходить» капчу Яндекса:

1) Между запросами должен быть интервал в 5 секунд, минимум!
2) Интервал должен быть динамическим. Т.е. не быть постоянным. В своих программах я использую следующую команду для паузы между запросами:

sleep( 5 + rand(5) );

p.s. финансовый отчёт будет завтра :)

6 комментариев:

  1. Спасибо за конкретику в 5 секунд, хотя по сути очевидная весч... я так же slip юзаю...

    ОтветитьУдалить
  2. ню-ню... 5 секунд пауза... Это 48 часов в сутки мало будет.

    mail.ru - вот выход.

    ОтветитьУдалить
  3. огромное спасибо за информацию! у меня старый обходчик по индексации заглох, из-за этой ошипки, а щас хоть исправлю... спасибо )))

    ОтветитьУдалить
  4. The end, не забывай, у мейла данные выдаются из кеша, который порой обновляется раз в 10-15 дней. Есть более интересный выход, но палить я его пока не буду :)

    ОтветитьУдалить
  5. Автор! Значение rand при аргументе 5 всегда одинаково.

    ОтветитьУдалить
  6. Анонимный18 ноября, 2009 01:54

    Сказки. Слип не имеет значение.

    ОтветитьУдалить

Внимание! Все ссылки проходят фейс контроль. Все ссылки REL=NOFOLLOW. Удаляются все комментарии, кроме: анонимных или с ссылками на личные финансовые блоги.