Ссылочный граф (web graph, link graph) — математическая модель интернета, в которой веб-страницы представлены как узлы (вершины), а гиперссылки между ними — как направленные рёбра (стрелки). Стрелка указывает от страницы, содержащей ссылку (донор), к странице, на которую ссылаются (акцептор). Поисковые системы строят и анализируют этот граф для вычисления PageRank и выявления авторитетных ресурсов.
Ссылочный граф веба насчитывает сотни миллиардов узлов (страниц) и триллионы рёбер (ссылок). Google и другие поисковые системы хранят и анализируют его в распределённых системах.
Свойства ссылочного графа
- Направленность — ссылки односторонние: A → B не означает B → A.
- Взвешенность — рёбра имеют вес (авторитетность донора).
- Масштаб-инвариантность — небольшое число узлов (Google, Wikipedia) имеет огромное количество входящих ссылок (закон степени).
- Кластеризация — сайты одной тематики образуют плотные кластеры взаимных ссылок.
Как используется для SEO
PageRank — итерационный алгоритм обхода ссылочного графа. Для каждого узла рассчитывается «авторитетность» на основе авторитетности узлов, ссылающихся на него. Алгоритм повторяется многократно до сходимости. Узлы с большим количеством входящих ссылок от авторитетных узлов получают высокий PageRank.
HITS vs PageRank
Альтернативный алгоритм HITS (Hyperlink-Induced Topic Search): разделяет узлы на «авторитеты» (на которые ссылаются) и «хабы» (которые ссылаются на авторитеты). Используется Яндексом (частично).
Часто задаваемые вопросы
Чем ссылочный граф полезен для практического SEO?
Понимание ссылочного графа объясняет, почему: 1) Ссылка с Wikipedia ценна — это высоко авторитетный узел с тысячами входящих ссылок. 2) Ссылки из «PBN» (частных блог-сетей) обнаруживаются — граф показывает неестественные кластеры взаимных ссылок. 3) Мощность домена важна — ссылка с DR 80 сайта ценнее ссылки с DR 10. 4) Внутренние ссылки с главной страницы мощнее — главная обычно имеет максимальный внутренний PageRank.
Как поисковики выявляют ссылочные фермы через анализ графа?
Ссылочные фермы создают аномальные паттерны в графе: плотные кластеры взаимных ссылок без семантической связи, одинаковые анкоры на сотнях сайтов, внезапное появление тысяч ссылок с низкоавторитетных доменов. Алгоритмы распознают «нереалистичные» структуры графа — в реальном вебе ссылки распределяются по степенному закону, а не равномерно. Google Penguin работает именно на анализе ссылочного графа.
Что такое «тематический PageRank» (TrustRank)?
TrustRank — идея разделения PageRank на «доверенный» и «недоверенный». Начинается с набора вручную проверенных «семенных» сайтов высокого доверия (правительственные, крупные университеты, Wikipedia). Страницы, близкие к этим узлам в ссылочном графе, получают высокий TrustRank. Это помогает бороться со спамными ссылками: спамные сайты получают ссылки от других спамных сайтов, а не от доверенных. Google и Яндекс используют похожие механизмы.
Может ли внешний вид графа измениться при переезде сайта?
Да. При смене домена (redirect 301 со старого на новый): поисковик постепенно обновляет граф — старые рёбра «переезжают» к новым URL акцептора. Процесс занимает недели или месяцы для крупных сайтов. В этот период позиции могут нестабильными — это нормально. Для ускорения: обновите ссылки на самые авторитетные ресурсах (попросите вебмастеров поменять URL), обновите Google Search Console и Яндекс Вебмастер, обновите sitemap.xml.