Векторный анализ: туда, куда GEO-инструменты ещё не доходили

· 6 min read
Векторный анализ: туда, куда GEO-инструменты ещё не доходили

Почти каждый SEO-инструмент «для эры ИИ» меряет одно и то же: упоминается ли ваш бренд в ответах ChatGPT или Perplexity. Упомянут или нет. Позиция в ответе. Тональность.

Это поведенческие данные. Они говорят, что произошло. Они не объясняют почему.

Мы сделали иначе.

Вопрос, который никто не задавал

Когда ChatGPT рекомендует Wise, а не Airwallex для международных переводов, или когда Perplexity выводит Certideal, а не Back Market на запрос про восстановленный iPhone — у этого есть математическое объяснение. Модель извлекла определённые фрагменты контента, сравнила их семантические векторы с вектором запроса и ранжировала их по косинусному сходству.

Этот процесс измерим. Его никто не измерял.

Любой GEO-инструмент на рынке — AIclicks, Profound, Rank Prompt, остальные — прогоняет название бренда по списку подсказок и считает упоминания. Это полезно. Но это смотреть на табло, не понимая правил игры.

Мы хотели понять игру.

Что на самом деле делает Vector Analysis

Ваш сайт — не просто текст. Как только ИИ с дополнением генерации поиском смотрит на страницы, он превращает контент в числовые векторы — многомерные представления смысла. Затем сравнивает их с вектором запроса пользователя и подбирает ближайшие совпадения.

Если для запроса в духе «лучший восстановленный iPhone Франция» вашим главным фрагментом оказывается панель навигации со ссылками на кредитные карты — у вас проблема. И она невидима для любого инструмента, который считает только упоминания.

Vector Analysis это показывает.

Вот что входит в аудит:

Извлечение на уровне фрагментов с оценками косинусного сходства. Мы берём реальные страницы, режем их так же, как это делают конвейеры поиска, строим эмбеддинги и прогоняем контент бренда по набору тестовых запросов. Видно, какие фрагменты всплывают и какие у них баллы относительно конкурентов на тех же запросах.

Эксперимент по извлечению на 30 запросах. Небрендовые коммерческие запросы, сгруппированные по кластерам намерения. По каждому: появился ли бренд, в какой позиции, с какой тональностью. Через ChatGPT, Claude, Perplexity, Gemini, Grok — в зависимости от выбранного режима.

Сравнение фрагментов с конкурентами. Не просто «Airwallex выше вас». Мы показываем, что фрагмент документации API Airwallex набирает 0,71 на запрос про «embedded finance payouts», а ваша страница платформы — 0,43 — и почему: у них техническая глубина, у вас в основном призывы к действию.

Оценка «шума» в DOM. Меню, подвалы, промо-баннеры, юридические дисклеймеры — это не просто визуальный шум. Они съедают лимит фрагментов. Мы считаем, какая доля проиндексированного контента семантически бесполезна для извлечения, вплоть до числа токенов.

Анализ близости в духе SERM. Когда бренд появляется в ответе ИИ, какие понятия рядом? Мы ловим случаи, когда негативные сигналы — жалобы, имена конкурентов, осторожные формулировки — совпадают с вашим брендом в результатах извлечения.

Автоопределение алиасов. Тинькофф и Т-банк — один бренд. Если у вас были старые названия, транслитерации или суббренды, их пропуск искажает картину. Мы находим алиасы автоматически по ответам.

Технический аудит поверхности. Карта сайта, robots.txt, hreflang, пробелы в структурированных данных, динамические параметры — всё, что влияет на то, смогут ли краулеры ИИ вообще добраться до контента.

Что мы увидели после прогонов

В разработке мы гоняли Vector Analysis на разных брендах. Несколько вещей стали очевидны сразу.

Проблема навигации универсальна. У Marks & Spencer главным фрагментом на запрос в духе «лучшие женские кардиганы до £50» оказалось меню с кредитками и страховками — балл 0,6358. Текст про кардиганы был ниже. Это не болезнь M&S, а архитектура, типичная для крупных интернет-магазинов, и счётчики упоминаний этого не увидят.

Блокировки JavaScript убивают извлечение. Испанские страницы рейсов easyJet отдают краулерам «You need to enable JavaScript to run this app». Девять из одиннадцати страниц. Верхний фрагмент на «дешёвые рейсы Барселона — Лиссабон» — незаполненный шаблон: «We're sorry, we don't offer direct flights from to {Destination}.» У Vueling статический HTML. Разрыв в извлечении огромен.

Сила бренда ≠ сила в извлечении. Back Market доминирует во французском сегменте восстановленной электроники. Trustpilot 4,2 из 5 по 66 000 отзывов. 17 млн клиентов. В 29 наших небрендовых запросах они попали в 20 ответов — узнаваемость тянет на обучающих данных. Но 89 % карточек товаров отдают краулерам 403. Конкурент Certideal, со слабее узнаваемостью, выигрывает на узких товарных запросах, потому что контент реально доступен.

Случай VW ломает ожидания. Volkswagen попал в 27 из 30 небрендовых запросов — лучший показатель из измеренных. При этом на страницах 60–70 % шаблонного повторяющегося текста и ноль разметки JSON-LD. Победа за счёт авторитета в обучающих данных, а не за счёт «пригодности» к извлечению. Как только этот запас сойдёт на нет — при переобучении моделей на более свежих и структурированных конкурентах — подспорья в инфраструктуре не останется.

Формат отчёта

Vector Analysis доступен в трёх режимах.

Fast — 10 запросов извлечения, ключевые страницы, отчёт за минуты. Для быстрой оценки положения.

Balanced — 20+ запросов, сравнение с конкурентами, расширенный техаудит. Уровень для ежемесячного контроля или передачи клиенту.

Deep — полный прогон: 30 запросов по кластерам намерения, косинусные оценки по каждому, бенчмарк конкурентов, алиасы, анализ близости SERM, полные техвыводы. Документ для маркетинг-директора или совета директоров.

Во всех режимах целью извлечения могут быть пять моделей: ChatGPT, Claude, Perplexity, Gemini, Grok. Сравните один бренд в разных моделях и отделите модель-специфические провалы от структурных.

Отчёты — в PDF, готовые к отправке клиентам или коллегам без дополнительной вёрстки.

Кому это нужно

Руководителям SEO, которым нужно объяснить разработчикам, что реально бьёт по видимости в ИИ — не догадки, а баллы фрагментов и токены.

Директорам по маркетингу, которым надо объяснить гендиректору, почему бренда нет в ответах ИИ при сильном домене и рейтинге Trustpilot в четвёрках.

Агентствам, которым нужен продукт, принципиально отличный от типового GEO-отчёта — потому что другая методология, а не только обложка.

CEO и лидам роста, которые понимают: сдвиг от ключевого поиска к ИИ-извлечению уже не «будущее». Это уже трафик высоконамеренной аудитории, и те, кто сейчас строит инфраструктуру извлечения, потом их сложнее сдвинуть.

Чего не скажут другие инструменты

Отслеживание упоминаний говорит: в брендовых запросах вы были 7 из 10 раз. Это число.

Vector Analysis говорит, что ваш лучший фрагмент на «лучший международный денежный перевод» — повторяющийся блок с призывами к действию, что контент про прозрачность среднерыночного курса — то, чем вы реально отличаетесь от PayPal, — зарыт на три экрана ниже под 350 токенами лишней навигации, и что документация API Airwallex обходит ваши платформенные страницы на запросах разработчиков, потому что у вас ссылки «Explore API documentation» ведут в никуда, а не на реальную документацию.

Это диагноз. И направление.

Запустить первый Vector Analysis

Открыть панель