Коротко о файле robots.txt

При заходе на сайт поисковый робот обращается к файлу «robots.txt» и следует его инструкции. Для управления поисковыми роботами, приходящими за очередным обновлением, веб мастера используют файл «robots.txt» В файле «robots.txt» указываются инструкции, а именно те директории сайта, которые поисковый робот не должен индексировать или наоборот.

Файл «robots.txt» имеет основные директивы :

User-agent:
Allow:
Disallow:
Host:
Sitemap:

Рассмотрим что означают эти директивы и как с помощью них можно управлять поисковыми роботами.

Директива User-agent

«User-agent» указывает, для какого именно поискового робота составлена инструкция. Обычно инструкция указывается для всех роботов, для этого используется знак *(звездочка). Если необходимо создать инструкцию для нескольких поисковых робот, то в файле «robots.txt» указываются дополнительные директивы «User-agent». Важно что инструкции составляются поочередно, сначала для одного поискового робота, потом для другого!

Примеры написания строки «User-agent»

User-agent: * → инструкция предназначена для всех поисковых роботов;

User-agent: Yandex → инструкция предназначена для поискового робота Яндекс;

User-agent: Googlebot → инструкция предназначена для поискового робота Google.

Директива Allow

«Allow» указывает, какие директории сайта можно индексировать. Сюда можно внести директории с загруженными картинками.

Пример написания строки «Allow»

Allow: /wp-content/uploads → разрешается индексировать папку «uploads»
Allow: /wp-content/gallery → разрешается индексировать папку «gallery»

Директива Disallow

«Disallow» указывает на те директории сайта, которые нужно исключить из индексации. К таким директориям относятся не информационные части сайта – это страницы регистрации и авторизации, формы административной части и статистики, формы поиска на сайте и т.д.

Пример написания строки «Disallow»

Disallow: /wp-register.php → запрещается индексировать форму регистрации на сайте;
Disallow: /wp-login.php → запрещается индексировать форму авторизации на сайте;
Disallow: /wp-admin/ → запрещается индексировать административную часть сайта.

Директива Host

«Host» указывает на основной домен сайта. Обычно имеет вид с «www» или без него.

Пример написания строки «Host»

Host: example.ru → указывает на основной домен сайта.

Директива Sitemap

«Sitemap» указывает на составленную карту сайта и её место расположение. В директиве «Sitemap» прописывается полный путь.

Пример написания строки «Sitemap»

Sitemap: http://example.ru/sitemap.xml → полный путь к карте сайта.

Создать файл «robots.txt» можно в обычном блокноте, сохранив его в формате .txt (текстовый файл). После создания, загрузите свой файл «robots.txt» в корневой каталог сайта, чтоб он стал доступен по адресу «http://example.ru/robots.txt»

Сделано в студии ladoga-design.ru