26 июля 2011

И еще раз про Яндекс

   Похоже, после недавнего случая с индексацией служебных каталогов "Мегафон", очень много людей кинулись искать подобные выдачи и небезуспешно, судя по той шумихе, что сегодня творится. На сей раз была обнаружена индексация статусов заказа с данными покупателей одного из интим-магазинов под названием Sexyz.Ru. Ссылку на выдачу не даю, исходя из этических соображений. Хотелось бы поговорить о другом. О безграмотности. Такое ощущение, что только к 2011 году пользователи русской части интернета обнаружили, что
поисковые системы индексируют (сохраняют в кэше) содержимое веб-страниц. Самое ужасное, что среди этих людей много неграмотных вебмастеров, или невнимательных. Акцентирую внимание, что Яндекс, Google и прочие поисковые системы просто делают свою работу. Есть файл robots.txt, указывающий поисковым роботам что можно индексировать, а что нет. Можно, конечно обвинить один из поисковиков в нарушении этих правил(как это делают не разобравшиеся  в  сути вопроса журналисты и блоггеры). Тогда как быть с остальными поисковиками? Сговор? Не думаю. Я посмотрел robots.txt у Sexyz.Ru. Он пустой. Потом обнаружился еще один интересный факт. Я исследовал код страницы статуса отправки, и обнаружил там код Яндекс-Метрики. Вот это тоже большой косяк со стороны админов. Тем, кто не понял, поясню, что этим действием админы сами сообщили поисковику о существовании данной страницы. Мало того, в теле страницы есть еще и код скрипта Google Analytics с функцией pageTracker, которая добавляет дополнительные поисковые системы в статистику.
   Резюме:
      -1. Заполняйте robots.txt, не ленитесь.
      -2. Коды аналитиков и счетчиков вставляйте только в те части ресурса, куда это действительно необходимо. Поверьте, счетчик в административной части сайта вам не нужен.)))

Update#1:
   Не, я честно в шоке. Многие уважаемые ресурсы пишут следующую хрень :
   - "Оказывается, «Яндекс» умеет находить не только sms-сообщения , но и фамилии, имена, адреса и содержание заказов покупателей некоторых интернет-магазинов".
   Все старо, как этот мир. Существует специальный язык управления выдачей запроса. Например классический поиск незакрытых директорий с помощью Google. Достаточно вбить в поиск "index.of/admin", и вы получаете содержимое кэша, удовлетворяющее вашему запросу. В данном случае -  содержимое проиндексированных  незакрытых  каталогов "admin". Вина на этом  только на владельцах, которые не приняли мер для закрытия каталога.

С уважением, ваш В.А

Комментариев нет:

Отправить комментарий