добавить
ссылку в
Email
Fb
подписка
RSS
Twitter
Email
Fb

Robots.txt

Что такое «Robots.txt»?

Файл, используемый для управления поведением поисковых роботов, заходящих на сайт. При помощи этого файла можно задать те файлы, каталоги и страницы сайта, индексация которых поисковыми системами нежелательна. Robots.txt должен создаваться в текстовом файле в формате Unix.

Директивы robots.txt

Управление поисковыми ботами осуществляется посредством задания в файле robots.txt специальных директив.

User-agent

Имя поискового робота, к которому будут применены ниженаписанные правила. Самые популярные в Рунете роботы:

  • Yandex — робот Яндекса;
  • Googlebot — робот Google;
  • StackRambler — робот Rambler;
  • Aport — робот Апорта.

Если же требуется применить правило сразу ко всем роботам, то в качестве параметра для User-agent следует указать символ * (звездочка).

Disallow

В этом поле указывается какие именно разделы сайта требуется запретить для индексации роботами указанными в директиве User-agent. В каждой записи должно присутствовать как минимум одно поле Disallow. Если требуется разрешить для индексации все страницы на сайте, то поле Disallow нужно оставить пустым. Для запрета к индексации всего сайта, в качестве аргумента для Disallow необходимо использовать параметр / (слеш).

Crawl-delay

Нестандартная директива. Задает временной интервал, который должен выдерживать поисковый робот между загрузкой страниц сайта. Вводиться с целью профилактики излишней нагрузки на сервер. По-умолчанию у большинства роботов этот параметр задан в 1-2 секунды.

Allow

Директива, обратная директиве Disallow. Задает страницы и разделы сайта, предписываемые к индексации.

Функции robots.txt

Файл robots.txt может выполнять следующие функции:

Запрет к индексации страниц, файлов и каталогов

Для запрета необходимо указать, какому роботу запрещается индексация и какие именно разделы попадают под это правило.

  • Запрещает ботам Яндекса посещать папку http://site.ru/test/ и файл http://site.ru/test.html
User-agent: Yandex
Disallow: /test/
Disallow: /test.html
  • Запрещает ботам Google посещать папку http://site.ru/test/ и файл http://site.ru/test.html
User-agent: Googlebot
Disallow: /test/
Disallow: /test.html
  • Запрещает посещение ботами Google и Апорт http://site.ru/temp/img/
User-agent: Aport
User-agent: Googlebot
Disallow: /temp/img/
  • Запрещает всем роботам индексировать сайт в целом
User-agent: *
Disallow: /

Назначение основного зеркала

Для этого используется директива Host. Но она поддерживается только Яндексом.

  • разрешено посещение всех страниц и папок на сайте, кроме http://site.ru/test/ основным зеркалом назначено http://site.ru/
User-agent: Yandex
Disallow: /test/
Host: site.ru
  • Простое назничение сайта site.ru основным зеркалом текущего сайта
User-agent: Yandex
Host: site.ru

Если если вам понравилась эта статья, вы можете подписаться на материалы моего блога через rssRSS или emailemail, а также присоединиться ко мне в twitterTwitter или vkontakteВКонтакте.

Последние статьи блога

18 интересных фактов о компании Google

18 интересных фактов о компании Google

Google — это та компаниния, которая не нуждается ни в представлении, ни в каком-либо сопроводительном описании. Но отслеживая жизненный путь таких гигантов, понемногу набирается цепочка фактов и любопытных замечаний, касательно компании-монстра.

В этой статье приводятся 18 наиболее интересных и достойных упоминания фактов из жизни и организации Google.

Приятного чтения и нескучного понедельника!

подробнее…
Дата 30 августа 2010 г. 5

Внутренняя поисковая оптимизация: творческий подход

Внутренняя поисковая оптимизация: творческий подход

Внутренняя оптимизация — одно из самых частоупотребимых слов в оптимизаторской среде. Но давайте проанализируем, что всплывает у нас в мозгу, когда мы слышим или видим это словосочетание. Заголовок, тайтл, ключевые слова в тексте, внутренняя перелинковка и… в большинстве случаев, пожалуй, на этом полет фантазии останавливается.

Но то, что нам больше ничего не приходит в голову, не значит, что больше ничего придумать нельзя. Поэтому, в этой статье мы с вами и рассмотрим некоторые методы внутренней поисковой оптимизации, не столь очевидные на первый взгляд, но безусловно полезные и, что самое главное, абсолютно легальные и белые, как первый декабрьский снег.

подробнее…
Дата 26 августа 2010 г. 5

8 сервисов для Twitter, о которых надо знать каждому

8 сервисов для Twitter, о которых надо знать каждому

У каждого из нас есть какие-то маленькие инструменты и сервисы, облегчающие жизнь и работу. Не стал исключением и Twitter, под который написаны уже сотни приложений. Давайте не будем останавливаться на банальных и общеизвестных сервисах, наподобие Twitpic и Bit.ly, о которых знает большинство твиплов. Вместо этого рассмотрим, гораздо менее известные и крупные сервисы, заточенные как правило, под одну задачу. Задачу популярную и требующую решения.

Приятного чтения! Надеюсь, каждый из вас найдет в этом списке хотя бы одно приложение, которое облегчит работу с этой популярной социальной сетью.

подробнее…
Дата 22 августа 2010 г. 2