BERT (Bidirectional Encoder Representations from Transformers) — алгоритм обработки естественного языка, разработанный Google и внедрённый в поиск в октябре 2019 года. BERT позволил Google значительно лучше понимать смысл запросов пользователей — особенно длинных, разговорных и содержащих предлоги и другие слова, несущие контекстный смысл.
На момент запуска Google назвал BERT одним из крупнейших изменений в истории поиска за последние пять лет. Алгоритм затронул около 10% всех поисковых запросов при первом запуске, а затем был расширен на русский и другие языки. Сегодня BERT используется для обработки большинства запросов в Google.
Как работает BERT
До BERT алгоритмы обработки языка анализировали слова преимущественно слева направо — то есть понимали контекст только в одном направлении. BERT работает иначе: он анализирует каждое слово запроса в контексте всех остальных слов одновременно, в обоих направлениях. Отсюда — «Bidirectional» (двунаправленный) в названии.
Это позволяет модели понимать роль предлогов, частиц и порядка слов, которые кардинально меняют смысл запроса. Классический пример от Google: запрос «brazil traveler to usa need a visa». Без BERT поиск мог интерпретировать его некорректно. BERT правильно понял роль предлогов и выдал результат о визовых требованиях для граждан Бразилии, въезжающих в США — а не наоборот.
Что BERT изменил в поиске
- Длинные и разговорные запросы — BERT особенно хорошо работает с запросами в формате вопросов и естественной речи: «что лучше купить для маленькой квартиры», «как объяснить ребёнку 5 лет что такое инфляция».
- Предлоги и маленькие слова — слова «не», «без», «для», «после» теперь корректно влияют на интерпретацию запроса, а не игнорируются алгоритмом.
- Featured Snippets — BERT применяется для выбора наиболее релевантного фрагмента страницы для блока с быстрым ответом в нулевой позиции.
- Голосовой поиск — разговорные запросы через голосовых ассистентов выигрывают особенно, поскольку BERT создан именно для понимания естественного языка.
Как BERT влияет на SEO
Главный посыл BERT для SEO-специалистов: алгоритм создан, чтобы понимать людей, пишущих естественно. Это значит, что оптимизация под намерение пользователя (search intent) стала ещё важнее, чем точные вхождения ключевых слов.
Конкретные следствия для SEO-практики:
- Не нужно специально оптимизировать под BERT — Google прямо говорит, что нельзя специально настроить сайт под BERT. Пишите для людей — BERT оценит.
- Качество раскрытия темы важнее плотности ключевых слов — BERT позволяет Google находить релевантный ответ даже если ключевое слово использовано в синониме или другой форме. Контент, полностью раскрывающий тему, важнее контента с максимальным повторением ключевика.
- Разговорный стиль получил преимущество — страницы в формате вопрос-ответ, FAQ-блоки, структуры «как сделать» отлично работают с BERT и часто выигрывают Featured Snippet.
- Семантические синонимы — BERT понимает смысловые связи между понятиями, поэтому использование синонимов и семантически связанных слов делает контент более релевантным для широкого спектра запросов.
BERT, MUM и Gemini: развитие технологий понимания языка
BERT стал основой для последующих языковых моделей Google. В 2021 году был представлен MUM (Multitask Unified Model) — в 1000 раз мощнее BERT, способный анализировать текст, изображения, видео и аудио одновременно на 75 языках. MUM используется для сложных мультиэтапных запросов.
В 2023–2024 годах Google интегрировал языковые модели семейства Gemini в поиск, в том числе в функцию AI Overviews. Эти модели значительно превосходят BERT по возможностям, однако BERT по-прежнему активно используется для задач понимания запросов в реальном времени благодаря своей эффективности.
Часто задаваемые вопросы
Нужно ли специально оптимизировать контент под BERT?
Нет. Google прямо указывает, что специальной «оптимизации под BERT» не существует. Алгоритм создан для лучшего понимания естественного языка — значит, лучший способ «работать с BERT» — писать понятно, полно и для реальных людей. Контент, хорошо отвечающий на вопросы пользователей, автоматически выигрывает от BERT.
На каких языках работает BERT?
BERT изначально был запущен для англоязычного поиска в октябре 2019 года. В декабре 2019 Google распространил его на более чем 70 языков, включая русский. Мультиязычная версия mBERT предобучена на большом корпусе текстов на разных языках, что позволяет ей понимать запросы на русском так же, как на английском.
Как BERT влияет на Featured Snippets?
BERT активно применяется для выбора фрагментов в блоке Featured Snippet (ответ в нулевой позиции). Алгоритм анализирует страницы и выбирает тот абзац или список, который наиболее точно и полно отвечает на запрос пользователя. Для захвата Featured Snippet важно: структурировать ответ в виде чёткого абзаца 40–60 слов, использовать H2 с формулировкой вопроса, добавлять нумерованные списки и таблицы.
Есть ли в Яндексе аналог BERT?
Да. Яндекс разработал собственные нейросетевые модели для понимания языка: Палех (2016) и Андромеда (2017) стали первыми шагами в этом направлении. В 2022 году Яндекс представил обновление Вега, использующее более современные языковые модели. Яндекс также разработал собственные трансформеры, адаптированные под особенности русского языка.