Зеркало сайта — полная или частичная копия веб-сайта, доступная по другому адресу: другому домену, поддомену или протоколу (http vs https). С точки зрения SEO зеркало создаёт проблему дублированного контента: поисковик видит два или более сайтов с идентичными страницами и должен решить, какой из них считать «оригиналом» для ранжирования.
В широком смысле зеркалами могут быть: www и non-www версии (www.site.ru и site.ru), http и https версии, тестовые субдомены (dev.site.ru), синдицированный контент на другом домене, резервные домены созданные «на всякий случай».
Как поисковики обрабатывают зеркала
- Яндекс — имеет специальный алгоритм «склейки зеркал»: выбирает главное зеркало и передаёт ему весь ссылочный вес дублей. Вебмастер может указать главное зеркало в Яндекс Вебмастере.
- Google — использует механизм canonical (
<link rel="canonical">): предпочитаемая версия страницы через canonical получает всю ссылочную силу дублей. Функционально похоже на «склейку», но реализовано иначе.
Типичные причины возникновения зеркал
- Миграция с http на https без настройки редиректов.
- Одновременно работающие www и non-www версии.
- Доступность сайта по нескольким доменам (рабочему и тестовому).
- Синдикация статей: статья опубликована на нескольких площадках.
Часто задаваемые вопросы
Как проверить, есть ли у сайта зеркала?
Методы проверки: 1) Введите в адресную строку все варианты URL: http://site.ru, https://site.ru, http://www.site.ru, https://www.site.ru — все должны редиректить на один адрес (301). 2) Google Search Console → настройки → проверьте добавленные версии домена. 3) Яндекс Вебмастер → сайты → проверьте, какое зеркало указано главным. 4) Ahrefs → Site Explorer → введите домен и посмотрите «Best by links» — нет ли нескольких версий в результатах. 5) Screaming Frog → сканирование сайта покажет canonical-атрибуты и редиректы.
Теряет ли сайт позиции из-за незакрытых зеркал?
Да, в нескольких сценариях: 1) Ссылочный вес делится между зеркалами — ни одно не получает максимального ранжирования. 2) Краулинговый бюджет тратится на дубли, а не уникальные страницы. 3) Яндекс может показывать в поиске «неправильное» зеркало. 4) Поисковик может выбрать нежелательную версию как каноническую. На практике Google хорошо справляется с www/non-www дублями автоматически, но http/https без редиректа — реальная проблема для ссылочного веса.
Как правильно устранить зеркало?
Пошаговый план: 1) Выберите главную версию (предпочтительно https + www или https без www — последовательно по всему сайту). 2) Настройте 301-редиректы с всех остальных версий на главную (в .htaccess или nginx.conf). 3) Добавьте canonical rel на все страницы, указывающий на главную версию. 4) В Яндекс Вебмастере укажите главное зеркало. 5) В Google Search Console добавьте preferred domain. 6) Проверьте через 2–4 недели: все дубли должны перестать появляться в индексе.
Что делать, если тестовый сайт попал в индекс как зеркало?
Срочные меры: 1) Закройте тестовый домен от краулеров немедленно: basic auth (самое надёжное) или IP whitelist на уровне сервера. 2) Добавьте Disallow: / в robots.txt тестового домена. 3) Если страницы уже в индексе Google — через Search Console «удалить URL» или дождаться деиндексации после закрытия. 4) Убедитесь, что на тестовый домен нет ссылок с внешних ресурсов — иначе деиндексация затянется. Профилактика: всегда закрывайте staging через htpasswd до публикации любого контента.