пятница, 22 мая 2009 г.

Палю фичу для любителей парсить

Очень часто на форумах можно встретить людей, которые ищут много выделенных IP адресов. Как правило целей всего две: а) раскидать сеть сайтов; б) парсить выдачу поисковых систем или прочих сервисов.

Большинство народу так и не удосуживается проверить, под каким IP адресом реально виден их запрос снаружи. Поясню. То, что вам выдали выделенный IP, вовсе не означает, что внешний запрос вашей программы будет идти под выделенным IP адресом. Внешний запрос - это пинг блога, парсер серпа и т.д.

Т.е., банальная ситуация, купил я у 3fn.ru кучу выделенных IP, раскидал сайтики. Через некоторое время смотрю по своему мониторингу и чую, что что-то не так. Начал проверять, оказывается!, все XX прямых IP выходят наружу через ОДИН IP адрес. Т.е. я наполняю блоги на разных IP, а пинговалка пингует Яндекс с одного IP. Опана, всё спалилось. И т.д.

Сегодня попробую проверить инфобокс на такую фичу.

10 комментариев:

  1. Если ты имеешь ввиду парсинг серпа с инфобоксовского тарифа "профи", то айпишник будет сервака, на котором ты находишься.

    п.с. надеюсь, мы не на одном серваке :))

    ОтветитьУдалить
  2. Анонимный22 мая, 2009 17:32

    > то айпишник будет сервака
    херовенько, тогда вся их маркетинговая задумка тарифа для сетки сайтов - фигня полная

    > надеюсь, мы не на одном серваке
    я поржал

    ОтветитьУдалить
  3. Анонимный22 мая, 2009 17:39

    Ба, миллиардер с миллионером общаются! :)

    ОтветитьУдалить
  4. Анонимный22 мая, 2009 17:59

    Анонимный, и не говори, и оба - бомжи :)))

    ОтветитьУдалить
  5. Анонимный22 мая, 2009 18:15

    Ребята!
    Учитесь как биндить сокеты
    По умолчанию коннект идет с первого адреса

    ОтветитьУдалить
  6. Весьма занятно...
    А как проверить адрес, с которого парсится выдача?

    ОтветитьУдалить
  7. Анонимный22 мая, 2009 23:25

    Andrey K., парсишь любой сервис, который показывает твой IP адрес.

    ОтветитьУдалить
  8. Думаю, это не так уж и страшно. Сколько у них клиентов пингуют Яндекс с этого IP? Или ты со всех этих сайтов пишешь по десятку постов за час? Тогда пиши с одного блога утром, со второго в обед, а третий оставляй на ужин :)

    ОтветитьУдалить
  9. Анонимный24 мая, 2009 00:31

    bomzhvkvadrate, во-первых, пинговалку привёл в пример, чтобы народ меня лучше понял. Во-вторых, объёмы 3-и поста в день - это писец. Я бы первые 100 баксов заработал к старости.

    ОтветитьУдалить
  10. Полезная фича курла - curl_setopt($ch, CURLOPT_INTERFACE, $extip); нужна для того чтобы курл ходил не с первого ип сервера, а с назначенного. Только что пришла в голову мысль - можно попробовать эту штуку запускать на шаред хостингах, где ИП вообще туча у каждого сервера, правда не понятно как они назначаются, дадут ли использовать не назначенный конкретно мне.

    ОтветитьУдалить

Внимание! Все ссылки проходят фейс контроль. Все ссылки REL=NOFOLLOW. Удаляются все комментарии, кроме: анонимных или с ссылками на личные финансовые блоги.