Миллионы пользователей ежедневно обращаются к чат-ботам на базе больших языковых моделей, ожидая получить не только ответы, но и ссылки на источники. И именно эти цитирования сайтов являются очень желанными для компаний, предлагающих AEO услуги, поскольку клиенты очень хотят, чтобы их сайт рекомендовали большие языковые модели. Это вызывает логичный вопрос: откуда именно LLM берут информацию для цитирования? Как на это влиять? Поэтому мы, как SEO специалисты, решили исследовать влияние индексации на цитирование LLM систем.
Центральная гипотеза исследования была сформулирована довольно просто и озвучена выше: индексированность страницы в поисковых системах (Google, Bing) влияет на цитируемость этой страницы в LLM системах.
Эксперимент имел целью ответить на три фундаментальных вопроса:
Ответы на них могут определить стратегии продвижения контента в ближайшие годы, когда AI-ассистенты постепенно вытесняют классические поисковые системы с роли основного инструмента поиска информации.
Для проверки гипотезы на существующем сайте https://game-dev.company/ были созданы страницы с вымышленными событиями и различными уровнями доступности для индексации. Выбор именно вымышленных событий был принципиальным: это позволяло исключить вероятность того, что LLM найдет информацию из альтернативных источников. Среди вымышленных мероприятий были Kyiv Game Dev Conference 2025 и Odesa Game Dev Conference 2025, а также контрольная страница о том, что Илон Маск посетил Крыжополь. Они звучали достаточно правдоподобно, чтобы не вызывать мгновенного подозрения у системы. Последняя новость была для того, чтобы выяснить, использует ли ChatGPT свои ресурсы для поиска информации или больше полагается на поисковые системы.
Каждая из трех страниц имела разный уровень доступности для поисковых систем. Первая (Kyiv Game Dev Conference 2025) была закрыта от индексации исключительно в Google через соответствующие директивы в robots.txt и meta-теги. Вторая (Odesa Game Dev Conference 2025) аналогично блокировалась для Bing, оставаясь доступной для Google. Третья страница (про Илона Маска) была полностью закрыта от индексации любыми поисковыми роботами, создавая контрольную группу для чистого эксперимента.
Тестирование проводилось четырьмя специалистами, каждый из которых имел собственную манеру формулирования запросов. Такой подход позволил избежать предвзятости, связанной с индивидуальным стилем коммуникации. Эксперимент включал системные запросы к LLM системе (Chat GPT):
Тестирование проводилось на трех языках: украинском, английском и русском.
Наиболее очевидным выводом стало подтверждение центральной гипотезы: страницы, индексированные в Google и Bing, действительно имели значительно больше шансов быть процитированными ChatGPT. Исследование выявило, что LLM системы активно используют данные из Google и Bing в процессе цитирования. Страницы, которые были проиндексированы в этих системах, имели значительно большую вероятность быть процитированными LLM. Скрин:
Интересным открытием стало то, что Chat GPT демонстрирует определенную форму критической оценки, когда сталкивается с вымышленными событиями. Система находила наиболее близкие реальные события и предлагала их пользователям как возможные альтернативы, пытаясь предоставить наиболее релевантную информацию. Скрин:
Когда пользователи явно указывали на конкретный сайт (https://game-dev.company/), Chat GPT демонстрировал способность находить и цитировать страницы с этого сайта, даже если они были закрыты от индексации в некоторых поисковых системах. Это свидетельствует о том, что LLM может иметь доступ к более широкому набору данных, чем просто проиндексированные страницы. Но это было не всегда. Скрин:
Как видно из проверок, Одесская конференция цитировалась лучше, чем Киевская.
Проверка о том, был ли Илон Маск в Крыжополе всегда давала отрицательный ответ и даже тогда, когда предоставлять статью с нашего сайта для ознакомления, система отмечала, что эта информация не является достоверной.
Многоязычное тестирование показало, что результаты были консистентными независимо от языка запроса, хотя некоторые вариации были замечены в качестве и релевантности ответов.
Эксперимент успешно подтвердил основную гипотезу: индексированность страницы в поисковых системах действительно влияет на цитируемость этой страницы в LLM системах.
Результаты этого эксперимента имеют значение для:
Наблюдаемая способность LLM к критической оценке информации и поиску альтернатив является позитивным сигналом для борьбы с дезинформацией. Системы не просто механически воспроизводят найденные данные, а пытаются верифицировать их и предложить пользователям наиболее релевантную информацию. Это создает определенный защитный барьер против манипуляций, хотя его эффективность еще требует дополнительного изучения.
Эксперимент демонстрирует, что эпоха AI не отменяет важность традиционных SEO практик, а трансформирует их, предоставляя новые измерения и возможности.
Контакты
Заявка на продвижение: [email protected]
Для партнерства: [email protected]
Спасибо за вашу заявку!
Наши специалисты свяжутся с Вами в течении 24 часов