Для чего нужен файл robots.txt

Файл robots.txt , так же называемый индексным файлом, является обычным текстовым документом в кодировке UTF-8. В данном файле располагаются инструкции для поисковых роботов, в которых указаны рекомендации о том, какие страницы или файлы требуется сканировать.

Во время обработки файла robots.txt поисковые роботы могут получить одну из трех инструкций:

Полный запрет на сканирование.
Полный доступ на сканирование.
Частичный доступ на сканирование.

Файл требуется размещать в корневой директории сайта в виде обычного текстового файла. После размещения файла необходимо убедится что он доступен по адресу https://ваш_домен.com.ua/robots.txt

Ниже указаны несколько правил, для примера.

User-agent является правилом, сообщающим о том, каким роботам необходимо просмотреть инструкции, указанные в файле robots.txt

Чтобы разрешить просмотр инструкций всем роботам, необходимо прописать следующее правило:
```
User-agent:*
```
Если же необходимо разрешить просмотр инструкции только для роботов google, требуется установить следующее правило:
```
User-agent: Googlebot
```
Disallow является правилом сообщающим, какую именно информацию не стоит сканировать.

Чтобы разрешить сканирование всей информации на сайте, необходимо прописать следующее правило:
```
Disallow:
```
Чтобы запретить сканирование всей информации на сайте, необходимо прописать следующее правило:
```
Disallow: /
```
Чтобы запретить сканирование только конкретной папки на сайте (в примере папка называется images), необходимо прописать следующее правило:
```
Disallow: /images/
```
Чтобы запретить сканирование только конкретного URL на сайте (в примере URL называется images.html), необходимо прописать следующее правило:
```
Disallow: /images.html
```
Чтобы запретить сканирование только конкретного файла на сайте (в примере файл называется images.jpg), необходимо прописать следующее правило:
```
Disallow: /images.jpg
```
Чтобы запретить сканирование всех файлов на сайте с определенным расширением (в примере указано расширение .jpg), необходимо прописать следующее правило:
```
Disallow: /*.jpg$
```
Allow является правилом сообщающим, какую именно информацию не требуется сканировать.

В случае, если необходимо запретить к сканирование всего сайта, кроме папки images необходимо прописать следующее правило:
```
Allow: /images
Disallow: /
```
Sitemap является правилом, сообщающим роботам расположение файла sitemap.xml, в котором находятся все URL адреса, обязательные для индексации:
```
Sitemap: https://ваш_домен.com.ua/sitemap.xml
```
Существуют и другие правила для файла robots.txt, более подробную информацию о которых возможно узнать на следующем ресурсе - https://support.google.com/webmasters/answer/6062608?hl=ru

Тэги: robots.txt, сайт, сео, seo, оптимизация сайта, продвижение сайта, файлы сайта

См.также:

Хостинг для сео продвижения

Как проиндексировать ваш сайт в Google

9 способов получить больше отзывов Google

Как продвигать свой блог в социальных сетях

Как написать описание продукта, который действительно продается: 8 простых советов

Как оптимизировать изображения для WordPress

Для чего нужен файл robots.txt

Влияет ли выделенный IP на SEO?

Киев	044 392-73-56
Харьков	057 728-49-18
Днепр	056 790-86-00
Одесса	048 734-56-54

Львов	032 229-58-50
Николаев	051 270-12-63
Полтава	053 262-53-74
Запорожье	061 228-69-91

.com.ua	.org.ua	.com	.org
.ua	.in.ua	.net	.biz

Киев	044 392-73-56
Kyivstar	098 530-59-84
Lifecell	093 770-96-09