ИИ-ассистент как единый интерфейс B2B-экосистемы
Эволюция от простого чата к операционной системе бизнеса

Современные B2B-компании сталкиваются с проблемой разрозненности цифровых каналов: сайт, личный кабинет клиента (ЛКК), кабинет менеджера (ЛКМ) и служба поддержки часто существуют независимо друг от друга. Мы предлагаем концепцию AI-ассистента — единого чат-интерфейса, соединяющего все эти элементы. Клиент или менеджер могут прямо в чате задать вопрос об заказе, доставке, оплате или найти нужный товар и получить точный ответ на основе актуальных внутренних данных компании.

Такой помощник становится «операционной системой» для взаимодействия и навигации: он помогает решать стандартные задачи, направляет пользователя к нужному разделу и по необходимости переключает на живого специалиста. В этой статье анализируем продуктовую концепцию, архитектуру (LLM+RAG+векторный поиск), ключевые сценарии, план внедрения и ожидаемые бизнес-эффекты внедрения AI-ассистента.

Примечание: В статье использованы внутренние материалы компании (обезличенная документация заказчиков), содержащие описания бизнес-требований. Эти данные обобщены и дополняют выводы, основанные на опыте Compo Soft и открытых источниках.
Проблема: разрозненные каналы и неэффективные ответы
В классических B2B-проектах данные о клиентах и процессах хранятся в разрозненных системах: ERP/CRM, каталоги товаров, «личный кабинет клиента» (ЛКК), кабинет менеджера (ЛКМ), базы знаний, документы и т.д. Клиент, желая узнать статус заказа, скидки или решить вопрос по оплате, вынужден перелистывать десятки разделов или обращаться в колл-центр. Менеджеры при этом часто тратят время на повторяющиеся задачи и ответ на стандартные вопросы. Поисковые системы (например, Elastic или OpenSearch) дают нерелевантные результаты («искали сыр — вышел бекон»), что добавляет неудобства. Отсутствие единого интерфейса приводит к задержкам, росту нагрузки на поддержку и недовольству клиентов.

Технологии AI могут решить эту проблему подходом Retrieval-Augmented Generation (RAG), когда ответы на запросы формируются не из статических шаблонов, а на основе актуальных данных компании. Модель не запоминает всю базу знаний (вся база знаний не помещается в контекст модели), а перед ответом выполняется семантический поиск по корпоративным ресурсам. Поиск выбирает наиболее релевантные фрагменты документов, после чего LLM использует их, чтобы сгенерировать точный и связный ответ.

Такой RAG-подход связывает ответы модели с проверенными источниками (сайтами, внутренними документами, CRM, каталогами), снижая «галлюцинации» и повышая надежность системы.
Продуктовая концепция: чат-помощник как системный интерфейс
AI-ассистент — это не просто FAQ-бот, а полноценный мультиканальный консультант и навигатор. Он объединяет внутренние сервисы компании (CRM, ERP, каталоги, документы) и управляется единым диалогом. При обращении пользователь сразу получает возможность спросить «все и про всё», не ограничиваясь разделом сайта или кабинетом. При этом бот может автоматически:

  • искать актуальную информацию по заказам, оплатам, доставке, договорам и претензиям;
  • объяснять значения статусов («что значит «клиент заблокирован», «заказ на согласовании» и т.д.);
  • показывать индивидуальные скидки и цены (ИЦ) для данного клиента;
  • предлагать замену товаров и рекомендации из ассортимента;
  • инициировать сервисные действия (создать претензию, оформить заказ, запросить документ);
  • перенаправлять на менеджера или техподдержку, сохраняя контекст диалога.

По сути, AI-ассистент становится «операционной системой» для клиентского сервиса: его чатом управляется навигация по системе (пользователь говорит, бот открывает нужный раздел), проверяются права доступа, а также работают внутренние API и скрипты. Для компании это автоматизация рутины и единая логика коммуникации: все цифровые каналы (сайт, мобильное приложение, ЛКК, колл-центр) говорят на одном языке.
Роли ИИ-ассистента
В рамках предложенной модели ИИ-ассистент выполняет несколько ролей:

  • Навигатор — показывает путь: «Где скачать счет», «Как оформить заказ», «Как добавить сотрудника».
  • Консультант — отвечает на стандартные вопросы: «Что означает этот статус», «Почему товар недоступен», «Какие документы нужны» и т.п.
  • Первая линия поддержки — закрывает типовые кейсы (поиск заказа, общие инструкции), снижая нагрузку на колл-центр.
  • Ассистент действий — не только отвечает, но и выполняет запросы: открывает нужный раздел, заполняет форму претензии, запускает сценарий оформления заказа.
  • Ассистент менеджера — в кабинете менеджера помогает подготовить сводку по клиенту, формирует черновики ответов, подбирает товары по потребностям и предлагает следующий шаг.
  • Шлюз к оператору — когда задача слишком сложна, ИИ аккуратно передает диалог на живого специалиста, сохраняя контекст и историю запроса.

Таким образом, ИИ-ассистент охватывает и клиентские, и внутренние потребности. По данным исследований, RAG-архитектура позволяет практически неограниченно расширять доступную модель памяти за счет внешнего хранилища, что критично для корпоративных данных (договоры, база знаний, счета и т.д.).
Омниканальная модель (сайт / ЛКК / ЛКМ / колл-центр)
AI-ассистент проявляет себя по-разному в зависимости от точки входа:

Сайт (без авторизации):

  • Предоставляет основную информацию о сервисе, региональных условиях, ассортименте.
  • Помогает с регистрацией и выбором кабинета («Я директор сети, мне нужен кабинет клиента или менеджера?»).
  • Квалифицирует лида и перенаправляет к продажам.
  • Роль: консультант/пресейл-ассистент, сопровождает переход в ЛКК/ЛКМ.

Личный кабинет клиента (ЛКК):

  • Ответы по текущим заказам, доставке, оплатам, документам и претензиям.
  • Навигация по разделам ЛКК (оплаты, история счетов, контракты).
  • Персонализированные рекомендации (товары из ассортимента клиента, акции).
  • Сопровождение операций (заполнение претензии, запрос ИЦ, загрузка документов).
  • Роль: персональный ассистент клиента — поддержка самообслуживания, первая линия поддержки.

Личный кабинет менеджера (ЛКМ):

  • Быстрый доступ к данным о клиенте: история заказов, взаиморасчеты, долги, открытые тикеты.
  • Формирование краткой сводки (контекста) перед встречей с клиентом.
  • Подсказки по следующему действию или товару (кросс-селл).
  • Автогенерация черновиков писем, предложений, ответов клиентам.
  • Роль: AI-копилот менеджера — повышает скорость и качество работы с клиентами.

Колл-центр / внутренний чат:

  • Операторы видят тот же диалог, что и клиент, и могут подключаться к чату при эскалации.
  • ИИ-ассистент предлагает подсказки операторам (например, «для этого клиента обычно подходят такие акции»).
  • Интеграция с базой знаний и тикет-системой (Confluence, Jira) для справки операторов.
  • Роль: единый цифровой пост для службы поддержки.

В каждом канале ИИ-ассистент адаптируется под роль и данные текущего пользователя, сохраняя общий стиль общения и базовую логику. История диалогов при этом может объединяться во внутренней системе, обеспечивая непрерывность: если клиент переходит с сайта в ЛКК или звонит оператору, предыдущие вопросы и ответы учитываются.
Ключевые сценарии использования
Ниже приведены основные виды запросов, которые должен закрывать ИИ-ассистент (на основе внутренних требований и практики):

  • Навигационные: «Где найти раздел счета/договора?», «Как сменить контакт?», «Как войти как другой сотрудник?».
  • Информационные: «Что значит статус заказа «Согласуется»?», «Почему товар недоступен?», «Что такое ИЦ?», «Какова минимальная сумма заказа?» и т.д.
  • Заказы: «Помоги оформить заказ», «Повтор заказа», «Какие у меня открытые заказы?», «Как заменить товар в заказе?».
  • Доставка: «Где мой заказ?», «Когда доставка?», «Почему перенесли дату?», «Как продлить время доставки?».
  • Оплаты/финансы: «Какие у меня неоплаченные счета?», «Как оплатить онлайн?», «Есть ли у меня задолженность?», «Почему ограничили заказ?».
  • Претензии: «Как подать претензию?», «Почему возврат отклонен?», «Куда прикрепить фото?».
  • Документы и ИЦ: «Скачать договор/акт», «Запросить индивидуальную цену», «Почему цена на товар изменилась?».
  • Регистрация/доступы: «Как зарегистрироваться?», «Почему не пришло письмо?», «Как сбросить пароль?», «Почему не вижу раздел?».
  • Каталог и продукты: «Найди товар по артикулу», «Подбери аналог [товара]», «Какие есть акции?» и др.

Это далеко не исчерпывающий список. Однако реализация указанных сценариев уже закроет до 80–90% типовых обращений в B2B-проекте.
Режимы работы ассистента
AI-ассистент может работать в нескольких режимах, отражающих уровень зрелости и доступа к данным:

  • FAQ-режим (консультант). Базовый уровень — ассистент отвечает на заранее известные вопросы из базы знаний. Это быстрый старт и понятный MVP, но ограниченная полезность (классический «улучшенный FAQ»).
  • Контекстный помощник. Ассистент учитывает текущую страницу/раздел: например, на странице заказа объясняет его статус, а в разделе «финансы» — отвечает по счетам.
  • Персонализированный ассистент. Учитывает данные конкретного пользователя: заказы клиента, его цены, история обращений. Например: «У вас три неоплаченных счета» или «Ваш статус сегодня — черновик заказа».
  • Action-oriented ассистент. Выполняет действия: открывает нужный раздел, заполняет форму, создает запись. Это уже полноценный AI-сервис, который не просто говорит, а делает.
  • Помощник для сотрудников. Внутри компании ассистент помогает составлять ответы клиентам (черновики писем), быстро собирать информацию по клиенту, подсказывает следующую стратегию. ИИ «сидит рядом» и ускоряет человеческий труд.

Поэтапный подход: начать с FAQ/консультанта, затем подключить персональные данные (поддержка реальных заказов), потом добавить возможности запуска действий, и финально — Помощник для сотрудников. Важно предусмотреть и гибридную модель: ИИ закрывает рутинные кейсы, а сложные передаются живому оператору с уже подготовленным контекстом.
Архитектура решения
Ключевым элементом является RAG + agent/tool-use layer. Схема работы упрощенно показана ниже:

flowchart LR

UserChat[Чат/Интерфейс пользователя] --> RAG[LLM + RAG Engine]
RAG -->|Поиск семантический| VectorDB[Векторная БД знаний]
VectorDB -->|Кандидаты| Reranker[Reranker]
Reranker -->|Ранжированные фрагменты| RAG
RAG --> DataSources[CRM/ERP, База знаний, Каталог]
RAG --> Tools[Инструменты/API (заказы, отчеты, документы)]
Tools --> DataSources
DataSources --> Tools
RAG --> UserChat
UserChat --> Auth[Проверка ролей/доступ]
RAG --> Log[Логирование/Аналитика]


Упрощенная архитектура RAG + agent/tool-use layer : чат-бот взаимодействует с ядром LLM+RAG, осуществляя векторный поиск по корпоративным данным и выполняя сервисные API-вызовы. Система учитывает роли пользователей и логирует все взаимодействия.

Пояснение: Пользователь задает вопрос в чате (UI). Система RAG сначала преобразует запрос в вектор  и ищет релевантные документы в векторной базе данных (VectorDB) — это хранилище векторных эмбеддингов всех корпоративных текстов. Затем отбираются N наиболее близких по смыслу фрагментов (семантический поиск). Модуль проверки доступа отсеивает те, к которым пользователь не имеет прав. Допустимые фрагменты передаются вместе с запросом в LLM, который генерирует ответ.

При необходимости ассистент использует инструменты/API для выполнения действий: запрашивает у CRM-транзакцию, создает задачу в системе, формирует PDF-счет. Все обращения и ответы логируются (для аудита и контроля качества).

Основные компоненты:

  • Чат-движок (UI). Единый интерфейс в сайте, ЛКК, ЛКМ. Может быть как всплывающее окно, так и отдельная страница.
  • LLM + RAG. Ядро, совмещающее модель LLM (например, OpenAI GPT или локальные аналоги) с модулем поиска. Модель не дообучается на данных компании, а получает контекст запросом. Это обеспечивает актуальность ответов.
  • Векторная БД (например, Qdrant). Хранит эмбеддинги текстов (каталоги, документация, база знаний, CRM-поля). Поддерживает масштабируемый семантический поиск. Qdrant, например, умеет хранить миллиарды векторов и сам текст для демонстрации результата.
  • Источники данных (DataSources). ERP/CRM, товарный каталог, договоры, акты, Confluence/Jira и др. С помощью ETL/ процессы новые документы разбиваются на фрагменты и индексируются в векторную БД.
  • Инструменты/API (Tools). Микросервисы для выполнения бизнес-задач (создание заказа, счет-фактуры, отчета, списка задач). Агент ИИ через них исполняет команды пользователя.
  • Управление доступом (RBAC). Ролевая модель гарантирует, что пользователь видит только свои данные. Как показано в практике Runity, бот работает от имени пользователя, проверяя доступ через API.
  • Логирование и мониторинг. Запись истории диалогов и действий, сбор метрик точности ответов и загрузки системы.

В этой архитектуре роль RAG — предоставить модели актуальный контекст. При вводе запроса система заранее готовит входные данные: выполняет семантический поиск по векторной базе, извлекает содержимое релевантных документов и передаёт только эти фрагменты в LLM вместе с запросом. Это позволяет обойти ограничение контекстного окна — вместо загрузки всей базы мы подставляем только релевантные куски. RAG не заменяет параметрическую память модели (знания, сохранённые в весах при обучении) — он дополняет её, подавая внешнюю информацию в момент запроса, а не встраивая её в веса модели.
Интеграция с поиском и рекомендациями
AI-ассистент тесно переплетается с существующими системами:

  • Поисковая система: Ассистент может дополнить или заменить классический поиск. Например, при запросе «Где мой заказ?» бот выполняет семантический поиск по базе заказов, вместо обычного SQL-фильтра. Точно так же он умеет искать в комментариях, каталогах или справочниках, используя векторный поиск.

  • Рекомендательная система: Если у компании есть рекомендательная система, ее результаты можно подключать через API. Например, менеджер спрашивает про товар — бот запрашивает рекомендованные аналоги для данного клиента. Или в чате клиенту «по порыву» показываются допродажные предложения на основе его профиля.

  • Ссылки на результаты: Ответы ИИ всегда сопровождаются ссылками на источник (номер заказа, URL документа). Это повышает доверие и позволяет пользователю перейти в нужный модуль.

Важно: ИИ-ассистент надстраивается над поиском и рекомендациями, а не полностью заменяет их. Он сам решает, когда делать семантический поиск, а когда вызвать API. Например, при вопросе про скидку бот может сразу обратиться к системе цен, а не перебирать инструкции из FAQ.
MVP и дорожная карта
Внедрение системы лучше разбить на этапы:

1. MVP

  • Чат-консультант (FAQ). Охватить базовые сценарии: «где мой заказ?», «доставка», «оплата», «документы». Интеграция с основными источниками: текущие заказы из ERP, статусы доставок, счета-фактуры из CRM. Это перевод стандартных запросов в новый чат-канал.
  • Семантический поиск. Загрузить справочники и FAQ в векторную БД и подключить простую модель. Первые ответы на сложные вопросы («что такое ИЦ?») уже будут сформированы по документам.
  • Ролевой доступ. Настроить авторизацию так, чтобы клиент видел только свои данные.
  • Интерфейс. Вывести чат на сайт и в ЛКК, провести пилот в ЛКМ.
  • Поддержка операторов. Настроить общий чат для колл-центра: операторы видят переписку клиента и при эскалации могут подключаться в реальном времени.

2. Персонализация и расширение

  • Подключить все источники данных: ERP/CRM, Confluence/Jira, EDI/ЭДО, каталоги.
  • Расширить семантический поиск: добавить векторы по товарному каталогу для подбора аналогов.
  • Инструменты действий: дать ассистенту право создавать или редактировать заказы, претензии, задачи.
  • Рекомендации: интегрировать модули ML для кросс-селла и up-sell.
  • Аналитика: внедрить измерение метрик (решено без оператора, время реакции, точность ответов).

3. Помощник для сотрудников и автоматизация

  • Запустить AI-подсказки для менеджеров: анализ клиентского портфеля, прогноз допродаж.
  • Проактивный чат: уведомления клиента (например, «у вас истекает срок оплаты», «в корзине остались товары»).
  • Расширить каналы (чат-бот в мессенджерах, голосовой помощник).
MVP и дорожная карта
Таблица 1. Приоритетные модули для MVP.

Модуль системы

Приоритет (MVP)

Комментарий

Чат-интерфейс

Высокий

Кроссплатформенный (сайт, ЛКК)

Семантический поиск

Высокий

Векторный движок по FAQ/документам

Интеграция с CRM/ERP

Высокий

Доступ к заказам, платежам, клиентским данным

API для операций

Средний

Создание/изменение заказа, претензии

Персональные данные

Средний

История покупок, индивидуальные цены

Поиск по каталогу

Средний

Подбор аналогов, товарные рекомендации

ЛКМ-консультант

Низкий

Расширенная поддержка менеджера

Логирование и аналитика

Средний

Сбор метрик качества ответов

Бизнес-эффекты и метрики
Внедрение AI-ассистента дает следующие преимущества:

  • Снижение нагрузки на поддержку: значительная часть запросов (до 50–70%) решается без оператора. Клиенты находят ответы самостоятельно в чате, экономя время компании.
  • Ускорение ответов: пользователю не нужно переключаться между системами — бот отвечает за секунды. Например, опыт LinkedIn показывает сокращение времени решения запросов на 28,6%.
  • Увеличение self-service: клиентам проще взаимодействовать, что повышает удовлетворённость (NPS) и может стимулировать повторные продажи.
  • Рост допродаж: персонализированные рекомендации и подсказки в чате повышают средний чек (AI-поддержка позволяет оперативно предложить дополнительные товары).
  • Консистентность коммуникации: единая логика чата снижает количество ошибок в ответах, а ссылки на источники повышают доверие к информации.
  • Накопление знаний: автоматически формируемая база интентов, FAQ и оценок работы бота становится основой для оптимизации процессов.

Метрики успеха включают уровень разрешенных без оператора вопросов (self-service ratio), среднее время обработки запроса, CSAT/NPS клиентов и рост выручки от кросс-/upsell.
Риски и ограничения
  • Инфраструктура и стоимость: разворачивание LLM и RAG-системы требует мощных серверов. Например, опыт Runity показывает, что для одной RAG-системы на Qwen (35B) нужны 4 GPU класса A100. Это обходится в сотни тысяч рублей в месяц на аренду. Решение — поэтапный бюджет: начать с облачного решения и масштабировать по мере необходимости. Также следует учитывать затраты на вычисления при API-использовании LLM (что особенно важно при высоком трафике).

  • Безопасность и доступы: классификация информации и разграничение прав критичны. Система должна работать в рамках RBAC: бот не должен «вытекать» за рамки прав пользователя. Нужна строгая аутентификация, аудит и шифрование данных.

  • Качество данных: AI-ассистент полезен лишь при актуальной информации. Требуются процессы регулярного обновления индексов и проверки контента (например, rebuild поиска при изменении договоров). Плохие или устаревшие данные приведут к ошибочным ответам.

  • Доверие пользователей: клиент может усомниться в ответе чат-бота. Поэтому важно сразу предусмотреть fallback: всегда должна быть опция связи с оператором, а у ИИ – ссылки на источники (внутренние документы) для самостоятельной проверки.

  • Изменение процессов: перевод части рутины в чат меняет бизнес-процессы (например, задачи поддержки). Это управленческий риск: нужно четко определить зоны ответственности и сценарии эскалации.
Итоги

ИИ‑ассистент как единый интерфейс — новая ступень цифровой трансформации B2B‑компаний. Он связывает разрозненные CRM, каталоги и базы знаний в единую систему диалога и действий. Благодаря RAG‑архитектуре ответы становятся более достоверными за счёт привязки выводов к проверяемым документам (grounding).

Персонализация же достигается отдельным механизмом: интеграцией с CRM/ERP и управлением правами доступа — система решает, какие именно клиентские или ролевые данные включать в контекст запроса. В результате бизнес получает оптимизацию ресурсов, снижение расходов на поддержку и улучшение клиентского опыта.

Compo Soft готова помочь на всех этапах: от быстрого пилота до полного разворачивания решения. Мы предлагаем провести PoC, оценить эффект и затем поэтапно внедрять AI-ассистента в вашу экосистему. Будем рады консультации и демонстрации наших наработок.