Атрибут rel canonical: что это и как правильно использовать

Что такое rel canonical

HTML-атрибут rel = «canonical» применяют для избавления от дублирующих страниц. Он прописывается в коде между тегами <head></head>. Если на странице присутствует атрибут, то поисковой робот считает страницу приоритетной (канонической). Она выводится в поисковую выдачу, а также на нее переходит ссылочный вес со страницы с одинаковым содержим. Дублирующие копии чаще всего распространены на сайтах интернет-магазинов.

Пример:

Есть сайт интернет-магазина, где продаются красные кроссовки. На страницу с указанным товаром ведут разные ссылки: через раздел «Скидки», блок «Распродажа» и фильтр подбора цвета. Каждая ссылка приводит на идентичную страницу, но адрес у них разный:

www.myshop.com/page1;
www.myshop.com/pagered1;
www.myshop.com/page_red1;

Поисковые роботы посчитают указанные веб-страницы дублями и снизят позиции сайта в выдаче. Тем не менее владелец ресурса заинтересован, чтобы красные кроссовки были доступны по всем трем ссылкам, так как это товар, который пользователи должны находить всегда по любому ключевому запросу. Чтобы не получить санкции поисковика, на одной из страниц прописывает тег rel = «canonical». Именно ее робот и будет сканировать. Другие ссылки станут неканоническими, то есть являться уже не копиями (дублями), а вариантами страницы или ее версиями.

Как атрибут canonical влияет на SEO

Чтобы сайт могли найти пользователи через поисковик, необходимо проиндексировать все его страницы. Робот заносит найденные и просканированные документы в специальный каталог поисковой выдачи. На индексацию поисковые роботы тратят существенные ресурсы, такие как интернет-трафик, а за это корпорациям вроде Google и Yandex приходится платить. Компаниям не выгодно нести подобные затраты на сканирование идентичного контента, поэтому ресурсы с дублями штрафуют, понижая их позиции в выдаче.

Когда веб-мастер прописывает каноникл, он подсказывает поисковику, какую страницу предпочтительней индексировать и выводить в индекс. Канонический тег для поисковиков не является обязательным, а лишь рекомендательным, иногда поисковик игнорирует его. Робот все-равно будет сканировать все страницы, но где есть тег rel = «canonical» считаются релевантными запросу пользователя. Эксперты Яндекса говорят, что контент, размещенный на неканонической странице, в одинаковой степени будет полезен людям, даже если он дублирует содержимое канонической страницы.

Тем не менее рекомендуется сокращать число страниц с одинаковым контентом. Это обусловлено тем, что у сайтов существует краулинговый бюджет. Это важный инструмент в SEO-продвижении веб-проекта, который представляет собой некий лимит на количество страниц сайта, которые робот может обойти в течение суток. Бюджет формируется из ограничений сервера и вычислительных возможностей поисковых систем. Кроме этого, лимит зависит от скорости сканирования и потребности в нем. Если на сайте есть дубли, то краулинговый бюджет будет быстро израсходован, а это не даст вывести в индекс новые ссылки и страницы с обновленным контентом.

Поисковики рекомендуют SEO-оптимизаторам уникализировать контент на дублях, добавляя фотографии, разное описание карточек товара. Если применяется постраничная разбивка, то для уникальности можно выводить на странице вместо 10 товаров 50 или 100.

Как указывать rel=canonical

Вместе с атрибутом rel = «canonical» прописывается тег <link», устанавливающий связь с внешним документом – ссылкой. Они обязательно должны располагаться в теге <head> страницы. Готовый код выглядит так:

Когда нужно прописывать канонический тег

Канонический тег прописывается не только в случаях, когда страницы доступны по разным ссылкам и на них размещен идентичный контент. Есть и другие случаи, когда нужно использовать каноникл:

появление разных дублей с UTM-метками, страниц с GET и POST параметрами;
появление копий на страницах с пейджингом – если страница с пейджингом (встречаются в интернет-магазинах, где используется постраничное разделение карточек товаров), то в коде требуется указывать каноническую ссылку на блок «Открыть все»: <link rel=“canonical” href=“https://myshop.com/category/sneakers/open-all” />.

Также канонический тег прописывается, если сайт имеет несколько языков, у ресурса присутствует версия для мобильных устройств и планшетных компьютеров, есть URL с префиксом и без него.

Как указать основной URL при помощи атрибута rel=“canonical”

Канонический тег для основной ссылки прописывается разными способами. В основном, вебмастера указывают каноникл в HTML-коде страницы между тегами <head></head>:

Есть страница https://myshop.com/*utm_source, где каноническим адресом будет https://myshop.com. В HTML-коде, URL канонической страницы указывается <link rel=“canonical” href=“https://myshop.com/” />.

Указать основной URL при помощи канонического атрибута можно в заголовке HTTP. Этот вариант рекомендован для документов формата PDF, так как в них нет разделов. Атрибут записывается так:

Link: <http://myshop/category/canonical-tags/>; rel=»canonical»

С помощью плагинов CMS также можно указать основной URL с каноническим тегом:

Для WordPress доступен плагин All in One SEO, предназначенный для внутренней оптимизации. С его помощью можно задать канонический URL для страницы в автоматическом режиме.
В Joomla настройки каноникла активируется путем включения SEF. Нужно открыть «Настройки», выбрать «Общие настройки» и «Настройки SEO». В этом разделе активировать опцию «Включить SEF (ЧПУ). После этого к URL вида /index.php?option (технические страницы) будет применяться тег rel= “canonical”. Для проверки нужно открыть HTML-код и убедиться в наличии тега в разделе <head>.
В Тильде также можно задать канонические ссылки. Для этого надо открыть «Настройки», «SEO», «Отображение в поисковой выдаче» и «Каноническая ссылка на страницу». Пропишите приоритетный URL и сохраните настройки.

Правила использования канониклов

Яндекс Справка советует придерживаться рекомендации – указывать канонический адрес в пределах одного домена. В качестве канонического адреса всегда задавать абсолютную ссылку (адрес страницы, указанный целиком: протокол + домен + папка + файл). Это нужно, чтобы робот правильно интерпретировал адреса и мог выполнить индексацию. Есть еще и относительные URL, где указывается сокращенный адрес страницы (домен + файл). Поисковый робот может проигнорировать подобные URL.

Пример:

правильно (абсолютная ссылка): https://myshop.com/catalog/sneakers/brand1/krasnyy-krossovki.html;
неправильно (относительная ссылка): myshop.com/krasnyy-krossovki.html.

Есть и другие правила использования канониклов:

ссылка должна быть действующей и отдавать код ответа сервера 200 ОК;
прописывать нужно только одну каноническую ссылку на страницу;
нельзя указывать последовательно несколько ссылок с тегом каноникл;
каноническая ссылка должна совпадать с той, которая указана в сайтмап.

Кроме этого, адрес должен быть доступен для индексирования. В robots.txt нужно проверить отсутствие директивы disallow у нужной страницы.

Как проверить каноническую страницу

Выполнить проверку канонической страницы допускается с помощью программного обеспечения Netpeak Spider. Это программа для технического аудита. Она проверяет страницы ресурса на предмет наличия в коде атрибута rel= canonical.

Пользоваться ей просто:

Ввести начальный URL ресурса в поле вверху окна программы.
Рядом со строкой ввода нажать кнопку «Старт».
Начнется сканирование ресурса (время полной проверки зависит от количества ссылок).

На главном экране появится поле «Сводка», где в режиме реального времени будет отображаться информация о ресурсе. Помимо кодов ответа сервера и наличия ненайденных страниц (404) будут отображаться сведения о канонических ссылках (пометка «Страницы/дубликаты с Canonical).

Частые ошибки

Большинство ошибок, допущенные веб-мастером не являются катастрофическими их вполне легко исправить:

Атрибут прописан в разделе <body>. Канонический тег не учитывается поисковым роботом, если он указан в разделе <body>. Достаточно проверить HTML-код и убедиться, что ссылка прописана в разделе <head>.
На странице присутствует сразу несколько канонических ссылок. На одну страницу приходится только один канонический тег. Поисковый робот распознает только одну ссылку, а другие проигнорирует. Нужно проверить HTML-код и оставить один тег.
Канонические ссылки разные. Такая ошибка возникает, если веб-мастер прописывал тег разными способами – через HTML-код, заголовок HTTP. Ссылка в коде страницы и заголовке HTTP должна совпадать.
Канонический адрес находится на другом домене. Канонические и неканонические URL всегда должны находится в пределах одного домена. То есть имя сайта в обоих URL должно быть одинаковым.

Каноникл очень важен для SEO-продвижения ресурса. SEO-специалисты должны знать, как с ним работать. Если правильно прописать тег, то это не только поможет избежать санкций от поисковика за страницы-копии, но и продвинуть сайт на более высокие позиции в выдаче.