Sitemap.xml (карта сайта в формате XML) — файл, содержащий список URL страниц сайта, предназначенный для поисковых роботов. Sitemap помогает поисковику обнаруживать и индексировать страницы быстрее и полнее — особенно те, до которых трудно добраться через обычные внутренние ссылки. Файл создаётся согласно протоколу Sitemap, разработанному Google, Yahoo и Microsoft совместно в 2006 году.
Sitemap — не обязательное требование для индексации (Google и так обходит сайты через ссылки), но важный инструмент для ускорения процесса, особенно для новых сайтов, крупных ресурсов и страниц без хорошей внутренней перелинковки.
Структура файла sitemap.xml
Базовый Sitemap содержит список URL с опциональными метаданными:
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>https://example.com/page/</loc>
<lastmod>2025-03-01</lastmod>
<changefreq>monthly</changefreq>
<priority>0.8</priority>
</url>
</urlset>
<loc>— абсолютный URL страницы. Обязательное поле.<lastmod>— дата последнего изменения страницы. Помогает роботу решить, перекраулить ли страницу.<changefreq>— ожидаемая частота изменений (always, hourly, daily, weekly, monthly, yearly, never). Носит рекомендательный характер.<priority>— относительная важность страницы на сайте (0.0–1.0). Главная обычно 1.0, остальные — 0.5–0.8.
Типы Sitemap
- Обычный XML Sitemap — список URL страниц сайта.
- Image Sitemap — список изображений для индексации в Google Images.
- Video Sitemap — список видеофайлов с метаданными для Google Video.
- News Sitemap — для новостных изданий, подключённых к Google News.
- Индексный Sitemap — файл, ссылающийся на несколько Sitemap-файлов. Используется, когда один Sitemap превышает лимит в 50 000 URL или 50 МБ.
Как зарегистрировать Sitemap
- Google Search Console — раздел «Индексирование» → «Файлы Sitemap». Добавьте URL файла (обычно /sitemap.xml).
- Яндекс.Вебмастер — раздел «Индексирование» → «Файлы Sitemap».
- В файле robots.txt — строка
Sitemap: https://example.com/sitemap.xml— поисковик автоматически обнаружит файл.
Что НЕ включать в Sitemap
Sitemap должен содержать только те страницы, которые вы хотите проиндексировать:
- Не включайте страницы с тегом
noindex— это противоречие сигналов. - Не включайте страницы, закрытые через robots.txt.
- Не включайте страницы с HTTP-статусом не 200 (редиректы, 404, 500).
- Не включайте дублированные страницы (страницы пагинации, URL с параметрами).
- Не включайте страницы за авторизацией (недоступные роботу).
Часто задаваемые вопросы
Обязательно ли создавать Sitemap для небольшого сайта?
Нет, но рекомендуется. Google может обойти небольшой сайт (до 100–200 страниц) через внутренние ссылки без Sitemap. Однако наличие Sitemap — хорошая практика даже для маленьких ресурсов: он помогает новым страницам быстрее попадать в индекс и даёт явный контроль над тем, что роботу предложено для обхода. WordPress и большинство CMS автоматически генерируют Sitemap — его создание не требует усилий.
Как часто обновляется Sitemap и нужно ли его перезагружать?
Sitemap должен обновляться при каждом добавлении или удалении страниц. Большинство CMS (WordPress с плагинами Yoast SEO или Rank Math) делают это автоматически. После обновления Sitemap поисковик узнаёт о нём через пинг (автоматически для зарегистрированных файлов) или при очередном обходе robots.txt, где указан путь к Sitemap. Вручную «перезагружать» зарегистрированный Sitemap не нужно.
Что делать, если в Sitemap ошибки в Google Search Console?
Наиболее частые ошибки: URL недоступен (файл по указанному пути не существует), URL содержит noindex-страницы (противоречие), URL содержит редиректы (нужно использовать конечный URL), неверный формат XML (проверьте синтаксис). Устраните ошибку, обновите файл и нажмите «Повторная проверка» в GSC. Ошибки в Sitemap не блокируют индексацию сайта, но могут замедлить её.
Сколько URL может содержать один Sitemap-файл?
Максимум 50 000 URL и 50 МБ на один файл. Если сайт крупнее, используйте индексный Sitemap (Sitemap Index) — файл, ссылающийся на несколько Sitemap-файлов. Индексный Sitemap также ограничен 50 000 ссылками на дочерние файлы, что даёт теоретический максимум 2,5 миллиарда URL — достаточно для самых крупных ресурсов.