Методология HTML

Мета тег запрета индексации страниц сайта

Robots

<Robots> – это простой инструмент для указания роботам поисковых систем, может ли страница быть проиндексирована и можно ли следовать по ссылкам со страницы.
До того как сайт готов лучше отключить индексацию в поисковых системах, чтобы на основе незаконченного сайта не попять вниз ранжирования сайтов. Также необходимо отключить индексирование технических страниц, таких как редирект и т.д.

Как и любой мета тег он должен быть помещен в область HEAD HTML страницы:


<html>
    <head>

        <meta name="robots" content="noindex,nofollow">

    </head>
<body>

Директивы понятные роботам Яндекса и Google.

Директивы INDEX указывают, может ли робот индексировать страницу. Директива FOLLOW указывает роботу, может ли он следовать по ссылкам со страницы. Значения по умолчанию – INDEX и FOLLOW. Значения ALL и NONE обозначают активность всех директив и, соответственно, наоборот: ALL=INDEX,FOLLOW и NONE=NOINDEX,NOFOLLOW.

all - Используется по умолчанию. Означает, что в отношении веб-страницы не предусмотрены исключающие правила для роботов.

noindex - Запрещает индексирование (отображение в поисковой выдаче) веб-страницы.

nofollow - Запрещает переход по ссылкам на веб-странице.

none - Запрещает индексирование и переход по ссылкам на веб-странице.

noarchive - Запрещает выводить ссылку на сохраненную копию веб-страницы в сниппете поисковой выдачи.

Примеры:

<meta name="robots" content="index,follow"> - разрешает индексирование и переход по ссылкам.

<meta name="robots" content="noindex,nofollow"> - запрещает индексирование и запрещае тпереход по ссылкам на веб-странице.

<meta name="robots" content="noindex,follow"> - Запрещает индексирование разрешает переход по ссылкам на веб-странице.

<meta name="robots" content="index,nofollow"> - Разапрещает индексирование и запрещает переход по ссылкам

Рекомендации по применению

Необходимо очень внимательно использовать мета-тег Robots, т. к. он может стать причиной непопадания страниц сайта в поисковую выдачу. Чтобы исключить возможные недоразумения, следуйте указанным рекомендациям:

- применяйте запрещающие директивы мета-тега Robots, совмещая их с директивами файла robots.txt и не допускайте конфликтов между ними;

- учтите, что директивы файла robots.txt выполняются в первую очередь: если в robots.txt установлен запрет на сканирование страницы, а на странице указан мета-тег Robots со значением all или другим равнозначным значением, то робот, следуя инструкции в файле robots.txt, не перейдёт на страницу и не проиндексирует её;

- исключайте индексирование ненужных в поисковой выдаче страниц сайта (виртуальная корзина, результаты поиска по сайту, дубли страниц и т. д.).