Кто парсит серп Яндекса или массово проверяет наличие ссылки в выдаче(например, посредством «YAP-а»), тот не раз сталкивался вот с такой картинкой:
Я – не исключение.
Экспериментируя, я нашёл решение, которое позволяет «обходить» капчу Яндекса:
1) Между запросами должен быть интервал в 5 секунд, минимум!
2) Интервал должен быть динамическим. Т.е. не быть постоянным. В своих программах я использую следующую команду для паузы между запросами:
sleep( 5 + rand(5) );
p.s. финансовый отчёт будет завтра :)
Спасибо за конкретику в 5 секунд, хотя по сути очевидная весч... я так же slip юзаю...
ОтветитьУдалитьню-ню... 5 секунд пауза... Это 48 часов в сутки мало будет.
ОтветитьУдалитьmail.ru - вот выход.
огромное спасибо за информацию! у меня старый обходчик по индексации заглох, из-за этой ошипки, а щас хоть исправлю... спасибо )))
ОтветитьУдалитьThe end, не забывай, у мейла данные выдаются из кеша, который порой обновляется раз в 10-15 дней. Есть более интересный выход, но палить я его пока не буду :)
ОтветитьУдалитьАвтор! Значение rand при аргументе 5 всегда одинаково.
ОтветитьУдалитьСказки. Слип не имеет значение.
ОтветитьУдалить