Rel canonical что это
Что такое атрибут rel=“canonical”, когда и как его использовать?
В этой статье мы разберём, как и для чего нужно использовать атрибут rel=“canonical”, а также на конкретных примерах опишем, когда его лучше применять.
Что такое rel canonical и для чего он нужен?
Таким образом, если на вашем сайте есть идентичный или очень похожий контент, доступный по разным URL, с помощью атрибута rel=“canonical” можно указать тот URL, который является предпочтительным для индексации.
Когда нужно использовать канонические ссылки
1. Для предупреждения появления различных дублей. Например:
В этом случае нужно добавить атрибут rel=“canonical” на все статические страницы сайта. Например, для страницы https://site.ru/category-1/page-2, rel=“canonical” будет выглядеть следующим образом:
2. Для доступных по разным URL страниц с очень похожим контентом.
Например, это могут быть страницы одной серии товара, который отличается только расцветкой или страницы товара, который расположен сразу в нескольких категориях.
В этом случае нужно указать со всех страниц rel=“canonical” на основную, приоритетную страницу.
3. На страницах пагинации, если в категориях сайта есть страницы «Показать всё».
В таком случае на каждой из страниц пагинации нужно указать канонической страницу «Показать всё».
Например, для страницы https://site.ru/category-1/page-2 нужно прописать канонический URL:
Как указать основной URL при помощи атрибута rel=“canonical”?
Прописать между тегами любой HTML-страницы
Это основной способ. Чтобы указать каноническую ссылку, пропишите между тегами на странице полный URL страницы, которая должна быть в индексе.
Например, для страницы https://site.ru/*utm_content= канонической будет https://site.ru/.
Для получения такого результата, на странице https://site.ru/*utm_content= мы указали тег:
Важно!
Чтобы снизить вероятность ошибки в элементах link, после атрибута rel=“canonical” используйте абсолютные, а не относительные ссылки.
В файле Sitemap
В XML-карте сайта вы можете прописать канонический (основной) URL для любой страницы.
Важно!
Атрибут rel=“canonical” — это рекомендация для поисковой системы, а не правило. В этом случае ПС могут проигнорировать их.
В заголовке HTTP
Лучше всего использовать для документов не HTML-формата. Например, для файлов формата PDF.
В таком случае сервер, при запросе дублирующего файла, должен отдавать ссылку на файл-оригинал:
Важно!
Этот способ подойдёт, если у вас есть доступ к настройкам сервера. Не рекомендуется использовать для HTML-документов.
С помощью плагина
Для CMS существуют различные плагины, которые позволяют настроить канонический URL. Например:
— для WordPress можно настроить canonical с помощью Yoast SEO;
— в OpenCart — реализовано в настройках CMS (нужно зайти в настройки товара и задать параметр SEO URL);
— для настройки атрибута canonical в Joomla (версии 3.х и выше) нужно включить в настройках CMS функцию SEF. После включения для технических страниц вида /index.php?option будет добавлен атрибут rel=“canonical” (с указанием URL на страницу с настроенным ЧПУ).
Как проверить правильно ли настроен rel=“canonical”?
Провести анализ можно специальной программой для SEO-анализа сайта — Screaming Frog SEO Spider.
С помощью этой программы вы увидите:
— какие страницы на сайте без атрибута rel=“canonical”;
— на каких страницах стоит атрибут rel=“canonical”, и какие страницы являются для них каноническими;
Основные ошибки использования rel=“canonical”
— Канонический URL отдаёт 404 ошибку.
— Указанный канонический URL находится на другом домене или поддомене.
— Каноническая ссылка не является индексируемой.
— Использование rel=“canonical” со страниц пагинации на первую страницу.
Для всех страниц пагинации неправильно прописывать канонической первую страницу. Это делает индексацию всех страниц пагинации невозможной.
Для страниц пагинации в качестве канонических нужно указывать эти же страницы.
Например, страница https://site.ru/category-1/page-2 должна содержать каноническую ссылку:
Если в категориях сайта есть страницы «Показать всё», на которых доступны все товары из категории — на каждой из страниц пагинации можно указать канонической страницу «Показать всё».
— Несколько ссылок rel=“canonical” с одной страницы.
Для одной страницы должна быть одна каноническая страница, в ином случае будет учтён только первый URL.
— Разные канонические URL.
Указывайте одни и те же канонические страницы при разных способах реализации атрибута (например, через XML-карту сайта и через rel=“canonical” на самой странице).
Заключение
Атрибут rel=“canonical” — удобный и полезный инструмент для поискового продвижения. При правильном использовании, он повысит эффективность работы и ускорит индексирование сайта, что, в свою очередь, существенно повлияет на его ранжирование.
Хотите узнать правильно ли настроен canonical на вашем сайте — обратитесь к нам.
Оптимизирую сайты с 2009 года. Люблю сложные кейсы, которые оказались не по зубам специалистам с других компаний. Делаю очень подробные аудиты.
Пишу статьи-инструкции на блог SiteClinic по SEO-инструментам и аналитике.
Любимая цитата: Чтобы добиться успеха, надо искренне любить то, чем вы занимаетесь.
Оцените мою статью:
Задайте их прямо сейчас, и мы ответим в течение 8 рабочих часов.
7 комментариев к статье “ Что такое атрибут rel=“canonical”, когда и как его использовать? ”
Про использование со страниц пагинации на первую страницу — полная чушь. Именно это и является единственным верным решением, если на странице «Показать все» очень много товаров. Такая страница будет долго грузиться и плохо восприниматься поисковиками.
Попадать страницам пагинации в индекс категорически не нужно, это практически бесполезные дубли. А ссылки с этих страниц поисковики прекрасно индексируют.
Добрый день, Александр!
Тут на самом деле ситуация какая-то скользкая…
я поднимал эту тему и с Еленой Першиной и отсматривал все возможные рекомендации от Google.
Смотрите,
— да, гугл порекомендовал делать на вьюол,
— Яндекс сначала рекомендовал ссылаться канониклом каждой страницы пагинации на 1-ю страницу, но потом понял, что моменты конфликтуют. и согласились, что да, давайте на вьюол.
Проблема, которая из этого возникает (во всяком случае для Яндекса) — это то, что (ссылаюсь на эксперименты Шакина (вроде)) Яндекс нормально в первые места не выводит страницы с весом более 10 мб. Т.к. долгая по-любому загрузка снижает ПФ.
Lazyload не решает этой проблемы, т.к. Яндекс НАСТАИВАЕТ, чтобы ему при первом обращении выдавали ВСЮ инфу. Но не для каждого владельца сайта просто сделать такую возможность — боту отдавать всю, а пользователю подгружать по лэзилоад.
Поэтому интересно Ваше мнение, как Вы бы сделали? Или, если Сергей Кокшаров близок (а я думаю, к сеоклинике он близок), то предложить ему поделиться своим золотым рецептом канониклов при пагинации + лэзилоад, который подойдет и для Яндекса и для Гугла.
Руководство по работе с канониклами
В этой статье собраны свежие данные на лето 2021 года о канонических страницах. Разобраны все возможные случаи использования атрибута rel=“canonical”. Рассмотрены основные ошибки при работе, а также даны ответы на популярные вопросы.
Определения каноничности
Каноническая страница — это страница, которую поисковая система считает главной в группе схожих по содержимому.
Неканоническая страница — это страница на которой размещен атрибут rel=»canonical» с адресом другой страницы.
Как выглядит атрибут каноникал
Атрибут rel=“canonical” может быть прописан двумя способами:
Какой из этих методов выбрать лучше всего, разберем в главе «Как указать канонический адрес страницы».
Процесс канонизации
Канонизация — это процесс выбора главной страницы среди дублей (одинаковых страниц доступных по разным адресам) и/или среди страниц с похожим контентом.
В подкасте Search Off the Record от 4 ноября 2020 сотрудник Google Мартин Сплитт рассказал, как поисковик обрабатывает канонизацию:
Сначала нужно обнаружить дубликаты, сгруппировать их вместе и отметить, что эти страницы дублируют друг друга. Затем для всех них нужно найти страницу лидера.
На вопрос: «Обнаруживает ли такой метод только точные дубли или частичные тоже?» специалист ответил:
У нас есть несколько алгоритмов, которые пытаются обнаружить и не учитывать шаблонную часть страниц. Так, например, мы исключаем навигацию из расчета контрольной суммы, убираем нижний колонтитул. Тогда у нас остается то, что мы называем центральным элементом, то есть центральное содержимое страницы, что-то вроде самой сути страницы.
После вычисления и сравнения контрольных сумм, те, которые похожи между собой (сильно или частично) мы объединяем в дублирующий кластер.
Далее по словам Мартина, необходимо выбрать один документ из кластера, который и будет показываться в результатах поиска:
Но вычислить какая из них будет ведущей в кластере не так просто. Есть случаи, когда даже людям будет сложно определить, какая именно страница должна отображаться в результатах поиска. Мы используем более 20 сигналов, чтобы решить, какую страницу выбрать как каноническую из дублирующего кластера.
После сравнения всех сигналов для всех пар страниц, мы приближаемся к фактическому определению канонической.
Почему канониклы важны для SEO
1) Поисковики не любят дублирующийся контент, потому что он засоряют выдачу. Так же алгоритмам бывает непросто выбрать правильно главную страницу. Атрибут rel=»canonical» подсказывает какой URL стоит индексировать.
Google и Яндекс заявляют, что они не всегда признают указанный канонический адрес. Из-за того, что теги каноничности считаются подсказками, а не директивами (указаниями). Учитываются различные сигналы (были рассмотрены выше). Грамотное использование тегов каноничности помогает снизить риск того, что робот сочтет канонической не ту страницу.
Поиск страниц с атрибутом rel=»canonical» на сайте
Что такое атрибут rel=»canonical»
Как прописать атрибут rel=»canonical» в коде страницы
Задается он с помощью тега LINK с атрибутом rel=”canonical” в блоке HEAD страницы. Для этого необходимо поместить в HEAD следующую запись:
Где «канонический URL» – это полный адрес страницы, которую вы считаете предпочтительной для индексации.
Пример атрибута rel=canonical в HTML-коде страницы:
В каких случаях применяют этот атрибут?
Почему rel=canonical важен для поисковых систем?
Атрибут rel=canonical позволяет поисковым системам определить среди страниц с одинаковым содержанием основную, которую нужно проиндексировать и вывести в результаты поиска.
Информация от Яндекс о поддержке поисковыми роботами rel=canonical появилась в 2011 году. Вы можете ознакомиться с рекомендациями от Яндекс по употреблению rel=canonical в разделе Яндекс.Помощь.
Google также официально рекомендует использовать rel=canonical для борьбы с повторяющимися URL. Об этом можно прочитать в руководстве Консолидация повторяющихся URL.
Почему нужно знать, на каких страницах сайта есть rel=canonical?
Например, известен кейс, когда на всех страницах сайта в качестве канонической прописали главную страницу, поэтому поисковые системы не могли проиндексировать все остальные страницы веб-ресурса.
Как обнаружить на сайте страницы с rel=canonical?
Быстро сделать это можно с помощью сервиса Labrika. Отчет «Страницы с rel=canonical» находится в разделе «Технический аудит» левого бокового меню.
Поставив галочки около нужных пунктов в верхней части отчета, можно отфильтровать его содержимое так, чтобы отображались данные только по rel=canonical с выбранными параметрами. Тогда вы сможете проверить наличие конкретных ошибок в указании канонической страницы.
Какие виды ошибок rel=canonical поможет определить Labrika?
Страницы с несколькими rel=canonical
На странице может быть указан только один канонический URL. В случае нескольких объявлений rel=canonical Google и Яндекс проигнорируют все указания канонических страниц.
Страницы с кросс-доменным rel=canonical
Чаще всего ссылка на другой домен при использовании атрибута rel=canonical происходит по ошибке. Если в качестве канонического адреса указан URL на другом домене или субдомене, Яндекс не учитывает канонический адрес. Google допускает выбор основного URL на стороннем домене, но рекомендует проверить правильность такого указания.
Ссылки с rel=canonical на несуществующие страницы
Указание главной страницы в качестве канонической на всех страницах сайта
Это считается грубой ошибкой, поскольку тогда все страницы веб-ресурса, кроме главной, не будут проиндексированы и не попадут в результаты поиска.
Канонический URL заблокирован для индексации
Не следует запрещать индексирование страниц, которые указаны как канонические. Это не позволит поисковым роботам их проиндексировать, и они не смогут участвовать в поиске. Если указанная в rel=canonical страница заблокирована от индексации, нужно снять блокировку или указать в качестве канонической другую страницу, которая доступна для индексирования.
В URL-адресе отсутствует префикс http или https
Абсолютные URL-адреса должны указывать полный путь к канонической странице, включая обозначение протокола (http:// или https://), например:
rel = canonical найден в
Руководство по использованию атрибута rel=canonical вы найдете в отдельной статье нашего сайта.
Канонические теги: простое руководство для начинающих
Статистика статьи
Показывает, сколько различных веб-сайтов ссылаются на этот контент. Как правило, чем больше сайтов ссылаются на вас, тем выше вы ранжируетесь в Google.
Показывает ежемесячный рассчетный поисковый трафик на эту статью по данным Ahrefs. Фактический поисковый трафик (по данным Google Analytics) обычно в 3–5 раз больше.
Количество ретвитов этой статьи в Twitter.
Поделиться этой статьей
Теги каноничности не являются чем-то абсолютно новым. Они существуют с 2009 г. — большую половину десятилетия.
Объединенные усилия к их созданию приложили компании Google, Microsoft и Yahoo. Зачем это было сделано? Чтобы предоставить владельцам сайтов способ быстрого и простого устранения проблем, связанных с дублированием контента.
И эти теги работают? Да, идеально… но только если вы знаете, как ими пользоваться!
Из этого руководства вы узнаете:
Что собой представляет тег каноничности?
Тег каноничности (rel=“canonical”) — это фрагмент кода HTML, который определяет основную версию для страниц с одинаковым, практически идентичным и очень похожим содержимым. Другими словами, если у вас есть одинаковый или похожий контент под разными адресами, вы можете использовать теги каноничности, чтобы указать, какая версия является основной, и которую, следовательно, нужно индексировать.
Как выглядит тег каноничности?
Теги каноничности имеют простой и понятный синтаксис, они размещаются в секции веб-страницы:
Вот что каждая часть этого кода значит на понятном нам языке:
Почему теги каноничности настолько важны для поисковой оптимизации?
Google не любит дублирующийся контент. Из-за него поисковику сложнее решить:
Слишком большой объем дублирующегося контента может плохо сказаться на вашем «краулинговом бюджете». Это значит, что Google может потратить определенное время на сканирование («краулинг») множества версий одной страницы вместо того, чтобы находить важный контент на вашем сайте.
Нежелательное расходование времени поисковиком Google на сканирование дублирующегося контента — это, безусловно, то, чего следует всячески избегать. Хотя Google и заявляет, что для большинства сайтов это не является проблемой.
Теги каноничности устраняют все эти проблемы. Они дают возможность сообщить Google, какую именно версию страницы поисковику следует индексировать и ранжировать, и где следует сосредоточить «ссылочный вес».
Если не указать канонический адрес, Google возьмет это дело в свои руки.
Полагаться в этом на Google — не самая лучшая идея. Поисковик может выбрать ту версию страницу, которую вы не хотели бы делать канонической.
Google заявляет, что поисковая система обычно, но не всегда, признает указанный канонический адрес. Это потому, что теги каноничности считаются подсказками, а не указаниями. До тех пор, пока они признаются, любые сигналы — такие как ссылки — должны сосредотачиваться на канонической странице.
Оптимальные методы использования тегов каноничности также помогают снизить риск того, что Google сочтет канонической нежелательную версию страницы.
Но у меня ведь нет дублирующегося контента, так ведь?
Допуская, что вы не публикуете одни и те же записи и страницы несколько раз, легко предположить, что на вашем сайте нет дублирующегося контента.
Но поисковые машины сканируют URL-адреса, а не страницы.
Это значит, что для них example.com/product и example.com/product?color=red — это уникальные страницы, несмотря на то, что для нас это одна и та же страница с идентичным или похожим содержимым.
Такие адреса называются параметризованными, и они являются частой причиной дублирования контента, особенно для интернет-магазинов, которые используют фильтры для навигации.
Например, интернет-магазин Brown Bag Clothing продает мужские рубашки. Это адрес их основной страницы для категории рубашек:
Если вы настраиваете фильтр на поиск только рубашек размера XL, к адресу будет добавлен параметр:
https://www.bbclothing.co.uk/en-gb/clothing/shirts.html?Size=XL
Если затем вы зададите в фильтре критерий поиска товаров синего цвета, добавится еще один параметр:
https://www.bbclothing.co.uk/en-gb/clothing/shirts.html?Size=XL&color=Blue
С точки зрения Google, это все разные страницы (даже несмотря на то, что их содержимое отличается незначительно).
Но не одни лишь интернет-магазины сталкиваются с проблемой дублирования контента.
Вот еще несколько распространенных причин возникновения такого нежелательного эффекта, которые относятся ко всем типам сайтов:
● Наличие параметризованных адресов для параметров поиска (например, example.com?q=search-term).
● Наличие параметризованных адресов для идентификатора рабочего сеанса (например, https://example.com?sessionid=3).
● Наличие отдельных версий страниц для печати (например, example.com/page и example.com/print/page).
● Наличие уникальных адресов для одних и тех же записей в разных категориях (например, example.com/services/SEO/ и example.com/specials/SEO/).
● Наличие страниц для разных типов устройств (например, example.com и m.example.com).
● Наличие AMP—версий страницы и версий, не относящихся к данной категории (например, example.com/page и amp.example/page).
● Выдача одинакового содержимого в варианте с www и варианте без www (например, http://example.com и http://www.example.com).
● Выдача одинакового содержимого в варианте https и варианте без https (например, http://www.example.com и https://www.example.com).
● Выдача одинакового содержимого по адресам с закрывающим слэшем и без него (например, https://example.com/page/ и http://www.example.com/page).
● Выдача одинакового содержимого на разных версиях адреса страницы, таких как страницы индексов (например, https://www.example.com/, https://www.example.com/index.htm, https://www.example.com/index.html, https://www.example.com/index.php, https://www.example.com/default.htm и т. д.).
● Выдача одинакового содержимого по адресам с заглавными буквами или без них (например, https://example.com/page/ и http://www.example.com/Page).
Во всех этих случаях очень важно правильно использовать теги каноничности.
Кроме того, существуют еще проблемы кроссдоменного дублирования контента. Если вы синдицируете контент, лучше всего добавлять к оригинальной статье отсылающий на нее же тег каноничности, и делать так, чтобы копии указывали статью как каноническую через кроссдоменный тег каноничности.
Это не всегда предотвращает попадание копий синдицированного контента в результаты поиска, но помогает снизить риск того, что копии окажутся в списке выше оригинала.
Когда контент распространяется средствами синдикации, становится достаточно сложно определить оригинальный источник данных. Поэтому мы рекомендуем использовать указатели каноничности или блокирование. Это может понадобиться тем, кто синдицирует свой контент. https://t.co/hblGLsD0ir pic.twitter.com/yjtx43II8j
Основные принципы использования тега каноничности на практике
Внедрить теги каноничности достаточно легко. Ниже мы рассмотрим четыре разных способа выполнения данной операции. Но какой бы способ вы не выбрали, есть пять золотых правил, о которых нельзя забывать.
Правило №1. Используйте абсолютные URL-адреса
Джон Мюллер из Google утверждает, что лучше всего не использовать относительные пути в элементе link с атрибутом rel=“canonical”.
Вы можете применять оба варианта, но я бы рекомендовал использовать абсолютные адреса, чтобы быть уверенным в том, что они будут правильно интерпретированы.
Поэтому следует остановить свой выбор на такой структуре:
Правило №2. Используйте адреса, введенные символами в нижнем регистре
Поскольку Google может считать разными два адреса, записанные одними и теми же символами, но в разном регистре, вы должны убедиться в том, что при указании адресов на вашем сервере применяются символы в нижнем регистре, а затем использовать записанные таким образом адреса в тегах каноничности.
Правило №3. Используйте правильную версию домена (HTTPS или HTTP)
Если вы переключились на SSL, удостоверьтесь в том, что вы не указываете адреса, не относящиеся к категории SSL (т. е. HTTP), в своих тегах каноничности, поскольку это теоретически может привести к путанице и получению неожиданных результатов. Если вы работаете в пределах защищенного домена, убедитесь в том, что вы указываете такую версию адресов:
Правило №4. Используйте автореферентные теги каноничности
Джон Мюллер из Google подчеркивает, что хотя автореферентные теги каноничности и не являются обязательными элементами, однако их использование настоятельно рекомендуется.
Я рекомендую [использовать] автореферентные теги каноничности, поскольку это лучше всего помогает нам понять, какую именно страницу вы хотите проиндексировать, или какой адрес должен быть у проиндексированной страницы.
Даже если у вас только одна страница, иногда ее можно вызвать через разные варианты адреса — например, с определенными символами в конце, в верхнем или нижнем регистре, с www или без. Все это можно конкретизировать с помощью тега rel canonical.
Вот как работает автореферентное указание каноничности: по сути, это тег каноничности с ссылкой на ту страницу, где он находится. Например, для страницы с адресом https://example.com/sample-page автореферентный тег каноничности будет таким:
Большинство популярных современных CMS (систем управления контентом) добавляют автореферентные ссылки автоматически, но если вы используете собственную CMS, ваш разработчик должен запрограммировать функцию их добавления.
Правило №5. Используйте один тег каноничности на страницу
Если на странице размещены несколько тегов каноничности, Google проигнорирует их все.
При наличии множественных объявлений rel=canonical, Google, скорее всего, проигнорирует все подсказки rel=canonical.
Как использовать теги каноничности на практике
Существуют пять известных способов указания канонических адресов. Это то, что называют сигналами каноникализации:
Плюсы и минусы каждого метода рассмотрены в официальной документации Google.
1. Указание каноничности с помощью HTML-тегов rel=“canonical”
Использование тега rel=canonical — это самый простой и наиболее очевидный способ указания канонического адреса.
Для этого просто добавьте приведенный ниже код в секцию любой страницы-копии:
Пример
Допустим, у вас есть интернет-магазин, продающий футболки. Вы хотите, чтобы адрес https://yourstore.com/tshirts/black-tshirts/ был каноническим, хотя доступ к содержимому этой страницы можно получить и через другие адреса (например, https://yourstore.com/offers/black-tshirts/)
Просто добавьте указанный тег каноничности на все страницы-копии:
При этом, если вы используете CMS, вам и не нужно дополнительно возиться с кодом вашей страницы. Это самый простой способ.
Настройка тегов каноничности в WordPress:
Установите плагин Yoast SEO и автореферентные теги каноничности будут добавляться автоматически. Чтобы выполнить индивидуальную настройку тегов, перейдите в раздел Advanced («Дополнительно»), предусмотренный для конкретной записи или страницы.
Настройка тегов каноничности в Shopify:
Shopify по умолчанию добавляет автореферентные канонические адреса для продуктов и записей в блогах. Для выполнения индивидуальной настройки адресов вам нужно отредактировать непосредственно файлы шаблонов (.liquid).
В этой теме приведена некоторая информация о том, как это можно сделать.
Настройка тегов каноничности в Squarespace:
Squarespace также добавляет автореферентные адреса по умолчанию. Но, как и в случае с Shopify, если вы хотите добавить собственный канонический адрес, вам нужно отредактировать код напрямую.
2. Указание каноничности через HTTP-заголовки
Пример
Представьте, что мы создали версию этой статьи в формате PDF и разместили ее в нашем подкаталоге blog (ahrefs.com/blog/*).
Вот как может выглядеть наш HTTP-заголовок для этого PDF-файла:
3. Указание каноничности через файлы sitemap
Google требует, чтобы неканонические страницы не включались в карты сайта (файлы sitemap). В них должны быть перечислены только канонические адреса. Все потому, что Google рассматривает перечисленные в файле sitemap страницы как такие, которые рекомендуется считать каноническими.
Но поисковик не всегда выбирает адрес из файлов sitemap в качестве канонического.
Мы не гарантируем, что указанные в sitemap адреса будут считаться каноническими, однако с их помощью легче определить канонические адреса для крупного сайта. Файлы sitemap — это полезный способ сообщить Google, какие страницы вы считаете наиболее важными на своем сайте.
4. Указание каноничности через редирект 301
Используйте перенаправление по коду 301, если хотите отвести трафик от адреса копии к канонической версии.
Пример
Допустим, ваша страница доступна по таким адресам:
Выберите один адрес в качестве канонического и перенаправьте остальные на него.
То же самое следует сделать для версий сайта HTTPS/HTTP и с/без www. Сделайте одну из версий канонической и перенаправьте на нее остальные.
Например, каноническая версия ahrefs.com — адрес HTTPS без www (https://ahrefs.com). Все приведенные ниже адреса перенаправляются на него:
5. Внутренние ссылки
То, как вы ссылаетесь с одной страницы сайта на другую, также является сигналом каноникализации.
Аналитик Google Джон Мюллер перечисляет все сигналы, использующиеся для определения канонических адресов, в этом видео #AskGoogleWebmasters:
Чем большую последовательность вы проявляете при использовании всех этих сигналов, тем проще поисковой системе определить, какой вариант канонического адреса является для вас предпочтительным. Как упоминает в этом видео Джон Мюллер, поисковик Google, кроме всего прочего, предпочитает адреса HTTPS адресам HTTP, а также чаще выбирает более привлекательные с его точки зрения адреса.
Как избежать распространенных ошибок каноникализации
Каноникализация — это довольно сложный процесс, поэтому существует множество заблуждений о том, как правильно к ней подходить.
Вот некоторые из распространенных ошибок, которые при этом совершают.
Ошибка №1. Блокирование неканонических адресов с помощью файла robots.txt
Блокирование адреса в файле robots.txt препятствует его сканированию поисковой системой, из-за чего она не сможет распознать и теги каноничности на соответствующей странице. Это, в свою очередь, не позволяет передавать «ссылочный вес» от неканонических страниц к каноническим.
Ошибка №2. Установка для неканонических адресов тега noindex
Никогда не смешивайте noindex и rel=canonical. Эти предписания противоречат друг другу.
Google, как правило, отдает приоритет тегу каноничности, о чем Джон Мюллер сообщает здесь. Но все равно, лучше так не делать. Если вы хотите, чтобы адрес не индексировался и при этом указывал на каноничный, используйте редирект 301. Либо применяйте rel=canonical.
Ошибка №3. Установка кода состояния HTTP 4XX для неканонических адресов
Установка кода состояния HTTP 4XX для неканонического адреса даст тот же эффект, что и использование тега noindex — Google не сможет распознать тег каноничности и передать «ссылочный вес» канонической версии.
Ошибка №4. Указание корневой страницы в качестве канонической для всех нумерованных
Нумерованные страницы не должны указывать первую страницу как каноническую. Вместо этого они должны определять в качестве канонических сами себя.
Почему? Как Джон Мюллер из Google сообщил на Reddit, это неправильный способ применения rel=canonical.
Для разбивки на страницы используйте теги rel=prev/next. Google их больше не применяет, однако Bing все еще пользуется ими.
Ошибка №5. Отказ от использования тегов каноничности с атрибутом hreflang
Атрибут hreflang применяется для указания языка и региона веб-страницы.
Google заявляет, что при использовании hreflang нужно «указать каноническую страницу на том же языке или языке, наиболее подходящем для его замены, если канонической версии на том же языке нет».
Ошибка №6. Установка нескольких тегов rel=canonical
Использование нескольких тегов rel=canonical приведет к тому, что Google, скорее всего, их проигнорирует. Это может произойти, если теги добавляются к странице несколькими агентами — например, системой CMS, темой и плагинами. Поэтому во многих плагинах предусмотрена опция перезаписи, призванная гарантировать, что плагин будет единственным источником установки тегов каноничности.
Эта проблема может возникнуть и при добавлении тегов через JavaScript. Если вы не указываете канонический адрес в HTML-ответе, а затем добавляете тег rel=canonical через JavaScript, то Google должен будет принять его во внимание при отрисовке страницы. Но если вы указываете канонический адрес в HTML, а затем заменяете его через JavaScript, Google получит противоречивые сигналы.
Ошибка №7. Использование rel=canonical в секции
Эта проблема может возникнуть при парсинге документа. Даже если исходный код страницы содержит тег rel=canonical в правильном месте, при конструировании страницы в браузере или ее отрисовке поисковой системой, множество причин вроде незакрытых парных тегов, вставок JavaScript или контейнеров в секции могут привести к тому, что секция закроется преждевременно. В таких случаях тег каноничности может быть случайно перемещен в секцию отрисованной страницы, где он не будет учитываться.
Как найти и устранить проблемы каноникализации на своем сайте
Выполняя каноникализацию, можно легко допустить ошибку, поэтому рекомендуется регулярно проверять свой сайт на наличие проблем с тегами каноничности и при выявлении устранять их как можно скорее.
Site Audit проверяет ваш сайт на наличие 100 проблем в сфере поисковой оптимизации, в том числе тех, которые относятся к использованию тегов каноничности.
Ниже приведены двенадцать проблем, связанные с тегами каноничности, которые могут быть выявлены с помощью Site Audit, а также способы их устранения:
1. Каноническая ссылка ведет на 4XX
Это предупреждение выдается, когда одна или несколько страниц указывают в качестве канонического адрес с кодом состояния 4XX.
Чем это плохо
Поисковые системы не индексируют страницы 4XX, поскольку те не работают. В итоге они игнорируют теги каноничности, указывающие на такие страницы, и зачастую индексируют другие (неканонические) версии страницы.
Как это исправить
Просмотрите проблемные страницы и замените мертвые (4XX) ссылки на канонические версии ссылками на работающие (200) страницы, которые следует индексировать.
2. Каноническая ссылка ведет на 5XX
Это предупреждение выдается, когда одна или несколько страниц указывают в качестве канонического адрес с кодом состояния 5XX.
Чем это плохо
Коды состояния HTTP 5XX указывают на наличие проблем с сервером, которые приводят к утрате доступа к канонической странице. Google вряд ли проиндексирует недоступные страницы, а значит и проигнорирует ссылку.
Как это исправить
Замените все канонические адреса, вызывающие ошибки, рабочими. Если указанные канонические ссылки выглядят корректными, поищите ошибки в настройках сервера. Имейте в виду, что эта проблема может носить временный характер (например, если проверка сайта выполнялась, когда сервер был перегружен, или сайт был закрыт для проведения обслуживания).
3. Каноническая ссылка перенаправляется
Это предупреждение выдается, когда одна или несколько страниц указывают в качестве канонического адрес, который, в свою очередь, перенаправляет на другой адрес.
Чем это плохо
Канонические ссылки обязательно должны указывать на наиболее авторитетную версию страницы. Перенаправляющий адрес — это не тот случай. В результате, поисковые системы могут неверно интерпретировать или проигнорировать тег каноничности.
Как это исправить
Замените канонические ссылки прямыми ссылками на наиболее авторитетную версию соответствующей страницы (то есть ту, которая возвращает код состояния HTTP 200 и не перенаправляет на другой адрес).
4. Наличие дублирующихся страниц без указателей каноничности
Это предупреждение появляется, когда существует одна или несколько идентичных либо очень похожих страниц, которые не указывают каноническую версию.
Чем это плохо
Поскольку каноническая страница не указана, Google попробует самостоятельно определить версию, наиболее подходящую для отображения в результатах поиска. Это может быть совсем не та версия, которую вы хотели бы видеть проиндексированной.
Как это исправить
Просмотрите группы дубликатов. Выберите одну каноническую версию, которая должна индексироваться в результатах поиска. Укажите ее как каноническую во всех страницах-дубликатах (а также добавьте к ней самой автореферентный тег каноничности).
5. Hreflang с указанием неканонической страницы
Это предупреждение появляется, когда одна или несколько страниц указывают неканонический адрес в своих hreflang-аннотациях.
Чем это плохо
Ссылки в тегах hreflang обязательно должны указывать на канонические страницы. Ссылки на неканонические версии страниц в аннотациях hreflang могут запутать поисковые системы.
Как это исправить
Замените ссылки в hreflang-аннотациях указанных страниц их каноническими версиями.
6. Отсутствие внутренних ссылок, указывающих на канонический адрес
Это предупреждение появляется в том случае, когда на один или несколько адресов, указанных в качестве канонических, не ведет ни одна внутренняя ссылка.
Чем это плохо
Посетители сайта не могу получить доступ к каноническим адресам, для которых не предусмотрены внутренние ссылки. Вместо этого посетители перенаправляются на неканоническую версию страницы.
Как это исправить
Замените все ссылки на неканонические страницы прямыми ссылками на канонические.
7. Указание неканонической страницы в файле sitemap
Это предупреждение появляется, когда в файле sitemap указана одна или несколько неканонических страниц.
Чем это плохо
Google указывает, что в файл sitemap не следует включать неканонические адреса. Причина заключается в том, что поисковая система рассматривает страницы в файлах sitemap как такие, которые предлагается считать каноническими. В файлы sitemap нужно вносить только те страницы, которые вы хотели бы видеть проиндексированными.
Как это исправить
Удалите неканонические адреса из файла sitemap.
8. Неканоническая страница указана как каноническая
Это предупреждение появляется в ситуациях, когда одна или несколько страниц указывают канонической страницу, которая сама указывает на другую каноническую. Это создает «цепочку каноничности», когда страница А определяет своей канонической версией страницу Б, а страница Б в свою очередь — страницу В.
Чем это плохо
Цепочки каноничности могут запутать и дезориентировать поисковые системы. В итоге они могут неверно интерпретировать или проигнорировать используемые теги каноничности.
Как это исправить
Замените неканонические ссылки в тегах каноничности на указанных страницах прямыми ссылками на канонические. Например, если страница А указывает канонической страницу Б, которая указывает канонической страницу В, замените каноническую ссылку на странице А ссылкой на страницу В.
9. URL-адрес Open Graph не совпадает с каноническим
Это предупреждение появляется, когда на одной или нескольких страницах канонический адрес не совпадает с адресом Open Graph.
Чем это плохо
Если адрес Open Graph не совпадает с каноническим, в социальных сетях будет представлена неканоническая версия страницы.
Как это исправить
Замените адрес Open Graph на указанных страницах каноническим адресом. Убедитесь в том, что оба адреса являются идентичными.
10. Каноническая ссылка с HTTPS на HTTP
Это предупреждение появляется, когда одна или несколько защищенных (HTTPS) страниц указывают незащищенную (HTTP) версию в качестве канонической.
Чем это плохо
HTTPS — это фактор ранжирования, поэтому имеет смысл указывать каноническими защищенные версии страниц везде, где возможно.
Как это исправить
Перенаправьте страницу HTTP на эквивалентную HTTPS. Если это невозможно, добавьте ссылку rel=“canonical” для перехода с HTTP-версии страницы на HTTPS-версию.
11. Каноническая ссылка с HTTP на HTTPS
Это предупреждение появляется, когда одна или несколько незащищенных (HTTP) страниц указывают защищенную (HTTPS) версию канонической.
Чем это плохо
HTTPS и так предпочтительнее HTTP. Поэтому наличие HTTP-версии страницы, указывающей HTTPS-версию канонической, можно считать нелогичным решением.
Как это исправить
Используйте редирект 301 с HTTP на HTTPS. Также следует заменить все внутренние ссылки на HTTP-версию страницы прямыми ссылками на ее HTTPS-версию.
12. Неканоническая страница принимает естественный трафик
Это предупреждение появляется, когда одна или несколько неканонических страниц отображаются в результатах поиска и принимают органический поисковый трафик (чего не должно быть).
Чем это плохо
Либо ваши теги каноничности проставлены некорректно, либо поисковая система предпочла проигнорировать указанные канонические ссылки.
Как это исправить
Проверьте, правильно ли прописаны теги rel=canonical на всех указанных страницах. Если дело не в этом, воспользуйтесь Инструментом проверки URL в Google Search Console, чтобы узнать, был ли определен в качестве канонического адрес, указанный в теге. Если адреса не совпадают, разберитесь, почему это произошло.
Напоследок
Теги каноничности не так уж сложны. С ними разве что поначалу не сразу все понятно.
Просто помните о том, что теги каноничности — это не прямые указания, а скорее подсказки, сигналы для поисковых систем. Проще говоря, поисковики могут выбрать канонической не ту версию, которую вы указали.
Вы можете воспользоваться Инструментом проверки URL в Google Search Console, чтобы узнать, какой канонический адрес указал пользователь, а какой выбрал Google.
Вот категории, которые Google использует в отчете об индексировании в Google Search Console, относящиеся к каноническим адресам:
● Альтернативная страница с правильным тегом каноничности. Тут отображаются страницы, для которых вы с помощью тега каноничности указали альтернативные версии, и данные указания были приняты. По сути, они, как и было задумано, консолидируются с выбранными вами страницами.
● Дубликат без выбранного пользователем канонического адреса. Это страницы-дубликаты, для которых не были указаны канонические версии. В этом случае Google выбирает каноническую версию за вас; так что если вам этот выбор не понравится, добавьте тег rel=canonical.
● Дубликат: Google выбрал канонический адрес, отличный от указанного пользователем. Тут приводятся случаи, когда Google решил игнорировать предложенный вами канонический адрес и выбрал другую версию для индексации.
● Дубликат: указанный адрес не выбран в качестве канонического. Это тоже тот случай, когда сигнал каноникализации (подача адреса в файле sitemap) был проигнорирован. В данном наборе дублирующихся страниц нет явно помеченных канонических адресов, и в таком случае Google считает,что в индексе должен быть представлен другой адрес (отличный от того, который вы указали).
Есть вопросы? Пишите мне в комментариях или в Twitter.