добавить
ссылку в
Email
Fb
подписка
RSS
Twitter
Email
Fb

Robots.txt

Что такое «Robots.txt»?

Файл, используемый для управления поведением поисковых роботов, заходящих на сайт. При помощи этого файла можно задать те файлы, каталоги и страницы сайта, индексация которых поисковыми системами нежелательна. Robots.txt должен создаваться в текстовом файле в формате Unix.

Директивы robots.txt

Управление поисковыми ботами осуществляется посредством задания в файле robots.txt специальных директив.

User-agent

Имя поискового робота, к которому будут применены ниженаписанные правила. Самые популярные в Рунете роботы:

  • Yandex — робот Яндекса;
  • Googlebot — робот Google;
  • StackRambler — робот Rambler;
  • Aport — робот Апорта.

Если же требуется применить правило сразу ко всем роботам, то в качестве параметра для User-agent следует указать символ * (звездочка).

Disallow

В этом поле указывается какие именно разделы сайта требуется запретить для индексации роботами указанными в директиве User-agent. В каждой записи должно присутствовать как минимум одно поле Disallow. Если требуется разрешить для индексации все страницы на сайте, то поле Disallow нужно оставить пустым. Для запрета к индексации всего сайта, в качестве аргумента для Disallow необходимо использовать параметр / (слеш).

Crawl-delay

Нестандартная директива. Задает временной интервал, который должен выдерживать поисковый робот между загрузкой страниц сайта. Вводиться с целью профилактики излишней нагрузки на сервер. По-умолчанию у большинства роботов этот параметр задан в 1-2 секунды.

Allow

Директива, обратная директиве Disallow. Задает страницы и разделы сайта, предписываемые к индексации.

Функции robots.txt

Файл robots.txt может выполнять следующие функции:

Запрет к индексации страниц, файлов и каталогов

Для запрета необходимо указать, какому роботу запрещается индексация и какие именно разделы попадают под это правило.

  • Запрещает ботам Яндекса посещать папку http://site.ru/test/ и файл http://site.ru/test.html
User-agent: Yandex
Disallow: /test/
Disallow: /test.html
  • Запрещает ботам Google посещать папку http://site.ru/test/ и файл http://site.ru/test.html
User-agent: Googlebot
Disallow: /test/
Disallow: /test.html
  • Запрещает посещение ботами Google и Апорт http://site.ru/temp/img/
User-agent: Aport
User-agent: Googlebot
Disallow: /temp/img/
  • Запрещает всем роботам индексировать сайт в целом
User-agent: *
Disallow: /

Назначение основного зеркала

Для этого используется директива Host. Но она поддерживается только Яндексом.

  • разрешено посещение всех страниц и папок на сайте, кроме http://site.ru/test/ основным зеркалом назначено http://site.ru/
User-agent: Yandex
Disallow: /test/
Host: site.ru
  • Простое назничение сайта site.ru основным зеркалом текущего сайта
User-agent: Yandex
Host: site.ru

Если если вам понравилась эта статья, вы можете подписаться на материалы моего блога через rssRSS или emailemail, а также присоединиться ко мне в twitterTwitter или vkontakteВКонтакте.

Последние статьи блога

Пишем инструмент для проверки наличия ссылок

Пишем инструмент для проверки наличия ссылок

Многие из вас наверняка используют для продвижения своих проектов, такую популярную вещь как покупка ссылок и статей "навсегда". Этот метод имеет очень много плюсов и, в долгосрочной перспективе, несомненно, выгоден. Но у него есть один большой недостаток — ваша честно купленная ссылка может в один прекрасный день быть просто снята, разместившим её вебмастером. Что же делать? Ответ очевиден — нам необходимо средство контроля размещения ссылок.

Не спешите бежать на биржу фрилансеров и искать и исполнителя, ведь написание этого скрипта — не такое сложное дело как кажется на первый взгляд. Постоянные читатели журнала наверняка помнят, что в одной из статей мы подробно разбирали процесс написания простого парсера на PHP. Настало время продолжить наши обучающие уроки для SEO-программистов и написать скрипт проверки ссылок на наличие.

подробнее…
Дата сегодня 5

Как установить счетчик на сайт

Как установить счетчик на сайт

Несомненный атрибут любого современного сайта — счетчик. Благодаря этому многофункциональному инструменту Вы всегда будете держать руку на пульсе ресурса. Сколько страниц Вашего детища просмотрели сегодня? Какое количество людей? Откуда они пришли? Что их заинтересовало? На эти и многие другие вопросы ответ даст сервис статистики. Разнообразных счетчиков существует предостаточно, но мы остановим свой выбор на одном из самых популярных и многофункциональных – Liveinternet.

подробнее…
Дата 26 июля 2010 г. 5

Добавляем сайт в крупнейшие поисковые системы мира

Добавляем сайт в крупнейшие поисковые системы мира

Регистрация в поисковых системах — то, с чего начинает жизнь любой сайт. Можно, конечно, обойтись и без этого предоставив поисковым системам возможность самостоятельно найти наш сайт, но лучше, все же, ускорить этот процесс и вручную добавить свой сайт в их индекс.

Не будем ограничиваться рамками Рунета и приведем список аддурилок и для зарубежных поисковых систем, включая поисковики даже для таких экзотических языков как китайский, хинди и арабский, поскольку найти на их сайтах форму добавления URL довольно проблематично. Впрочем "экзотических" возможно, не самое удачное слово для языков занимающих первые три места в мире по численности говорящих на них:)

подробнее…
Дата 22 июля 2010 г. 2