Мільйони користувачів щодня звертаються до чат-ботів на базі великих мовних моделей, очікуючи отримати не лише відповіді, а й посилання на джерела. І саме ці цитування сайтів є дуже бажаними для компаній, що пропонують AEO послуги, оскільки клієнти дуже хочуть, шоб їх сайт рекомендували великі мовні моделі. Це викликає логічне запитання: звідки саме LLM беруть інформацію для цитування? Як на це впливати? Тому ми, як SEO фахівці, вирішили дослідити вплив індексації на цитування LLM систем.
Центральна гіпотеза дослідження була сформульована доволі просто, і озвучена вище: Індексованість сторінки в пошукових системах (Google, Bing) впливає на цитованість цієї сторінки в LLM системах.
Експеримент мав на меті відповісти на три фундаментальні запитання.
Відповіді на них можуть визначити стратегії просування контенту в найближчі роки, коли AI-асистенти поступово витісняють класичні пошукові системи з ролі основного інструменту пошуку інформації.
Для перевірки гіпотези на існуючому сайті https://game-dev.company/ створено сторінки з вигаданими подіями та різними рівнями доступності для індексації. Вибір саме вигаданих подій був принциповим: це дозволяло виключити ймовірність того, що LLM знайде інформацію з альтернативних джерел. Серед вигаданих заходів були Kyiv Game Dev Conference 2025 та Odesa Game Dev Conference 2025 і контрольна сторінка про те, що Ілон Маск відвідав Крижопіль. Вони звучали достатньо правдоподібно, щоб не викликати миттєвої підозри у системи. Остання новина було для того, щоб з’ясувати чи використовує ChatGPT свої ресурси, щоб знаходити інформацію або покладається більше на пошукові системи
Кожна з трьох сторінок мала різний рівень доступності для пошукових систем. Перша (Kyiv Game Dev Conference 2025) була закрита від індексації виключно в Google через відповідні директиви в robots.txt та meta-теги. Друга (Odesa Game Dev Conference 2025) аналогічно блокувалась для Bing, залишаючись доступною для Google. Третя сторінка (Про Ілона Маска) була повністю закрита від індексації будь-якими пошуковими роботами, створюючи контрольну групу для чистого експерименту.
Тестування проводилось чотирма спеціалістами, кожен з яких мав власну манеру формулювання запитів. Такий підхід дозволив уникнути упередженості, пов’язаної з індивідуальним стилем комунікації. Експеримент включав системні запити до LLM системи (Chat GPT):
Тестування проводилось трьома мовами: українською, англійською та російською.
Найбільш очевидним висновком стало підтвердження центральної гіпотези: сторінки, індексовані в Google та Bing, справді мали набагато більші шанси бути процитованими ChatGPT. Дослідження виявило, що LLM системи активно використовують дані з Google та Bing під час процесу цитування. Сторінки, що були індексовані в цих системах, мали значно більшу вірогідність бути процитованими LLM. Скрін:

Цікавим відкриттям стало, що Chat GPT демонструє певну форму критичної оцінки, коли стикаються з вигаданими подіями. Система знаходила найбільш близькі реальні події та пропонувала їх користувачам як можливі альтернативи, намагаючись надати найрелевантнішу інформацію. Скрін:
Коли користувачі явно вказували на конкретний сайт (https://game-dev.company/), Chat GPT демонстрував здатність знаходити та цитувати сторінки з цього сайту, навіть якщо вони були закриті від індексації в деяких пошукових системах. Це свідчить про те, що LLM може мати доступ до більш широкого набору даних, ніж просто індексовані сторінки. Але це було не завжди. Скрін:

Як видно з перевірок, Одеська конференція краще цитувалась, ніж Київська.
Перевірка про те, чи був Ілон Маск в Крижополі завжди надавала негативну відповідь і навіть тоді, коли надавати статтю з нашого сайту для ознайомлення, система зазначала що ця інформація не є достовірною.
Багатомовне тестування показало, що результати були консистентними незалежно від мови запиту, хоча деякі варіації були помічені в якості та релевантності відповідей.
Експеримент успішно підтвердив основну гіпотезу: індексованість сторінки в пошукових системах дійсно впливає на цитованість цієї сторінки в LLM системах.
Результати цього експерименту мають значення для:
Спостережена здатність LLM до критичного оцінювання інформації та пошуку альтернатив є позитивним сигналом для боротьби з дезінформацією. Системи не просто механічно відтворюють знайдені дані, а намагаються верифікувати їх та запропонувати користувачам найбільш релевантну інформацію. Це створює певний захисний бар’єр проти маніпуляцій, хоча його ефективність ще потребує додаткового вивчення.
Експеримент демонструє, що епоха AI не скасовує важливість традиційних SEO практик, а трансформує їх, надаючи нові виміри та можливості.
Контакти
Заявка на просування: [email protected]
Для партнерства: [email protected]
Дякуємо за заявку!
Наші спеціалісти зв'яжуться з вами протягом 24 годин