Дубли страниц — технический SEO-термин, обозначающий ситуацию, когда один и тот же (или практически идентичный) контент доступен по нескольким разным URL. В отличие от широкого понятия «дублированный контент», «дубли страниц» чаще используется применительно к внутренним проблемам конкретного сайта: технически сгенерированным URL, которые поисковик видит как отдельные страницы.
Типы дублей страниц
- Протокольные дубли — http и https версии одного URL.
- Дубли с www/без www — site.ru и www.site.ru.
- Дубли с trailing slash — /page и /page/ (для некоторых CMS).
- Параметрические дубли — /page?utm_source=google, /page?sort=asc, /page?ref=email.
- Дубли пагинации — страница 1 содержит тот же контент что и /page/1/.
- Теговые дубли — страницы тегов и категорий с пересекающимися постами.
- Дубли сессий — /page?PHPSESSID=xxx (идентификаторы сессий в URL).
Особенно актуально для e-commerce
Интернет-магазины наиболее уязвимы: тысячи URL с фильтрами (цвет, размер, цена) создают тысячи дублей. Карточка товара доступна через несколько категорий (/category-a/product и /category-b/product). Решения: canonical на основной категории, noindex на страницах фильтров, параметры URL в Search Console.
Часто задаваемые вопросы
Как WordPress создаёт дубли страниц?
WordPress — главный источник дублей для SEO-специалистов: 1) Archive pages: archives/?p=123 и /post-slug — разные URL одного поста. 2) Feed: /feed/ — RSS страницы в индексе. 3) Author archives: /author/admin/ с одним постом. 4) Tag pages: /tag/seo/ с тем же контентом что и /category/seo/. 5) Paginated archives: / и /page/2/ могут иметь похожий контент. Решения в WordPress: плагин Rank Math или Yoast SEO — noindex на тегах, авторах, пагинации. Дополнительно: canonical в теме на все нестандартные URL.
Что хуже для SEO: дубли страниц или тонкий контент?
Оба вредят, но по-разному. Дубли страниц: размывают ссылочный вес, увеличивают бессмысленный краулинговый бюджет, мешают правильной индексации. Тонкий контент: прямой сигнал низкого качества сайта для алгоритма Panda/Helpful Content. Тонкий контент опаснее с точки зрения алгоритмических санкций. Дубли — больше технический ущерб. При ограниченных ресурсах приоритет: 1) Устраните дубли дублирующих страниц (canonical, редиректы). 2) Улучшите тонкий контент или закройте noindex.
Насколько опасны параметры UTM как источник дублей?
UTM-параметры создают дубли только если поисковик их индексирует. Защита: 1) Robots.txt: Disallow: /*?utm_ — закроет все UTM-URL от краулинга. 2) Google Search Console → «Устаревшие параметры URL» → укажите utm_* как параметры без контентных изменений. 3) Canonical rel=canonical без параметров на всех страницах. В Analytics UTM работают без индексации — пользователи переходят по ссылкам, Яндекс/Google не индексирует эти URL. Проблема только если UTM попали в sitemap или кто-то сослался на URL с параметрами.
Как найти все дубли на сайте за один раз?
Комплексный аудит: 1) Screaming Frog SEO Spider → запустите сканирование → вкладка «Duplicate» → увидите дубли по контенту, заголовкам, мета-описаниям. 2) Google Search Console → «Индексирование» → «Страницы» → раздел «Дубли без тега canonical» и «Дубли, canonical отличается от пользовательского». 3) Ahrefs Site Audit → «Content Quality» → «Duplicate pages». 4) site:yoursite.com -intitle:»уникальное слово из страницы» в Google — ищите неожиданные URL. Полный аудит дублей рекомендуется раз в квартал для активных сайтов.