RAG для компании нужен тогда, когда ответ должен опираться на ваши документы — регламенты HR, базу поддержки, шаблоны договоров — а не на «общую память» ChatGPT. Если сотрудники или клиенты задают вопросы по внутренним правилам, а формулировки каждый раз разные, RAG ищет фрагменты в корпоративной базе и строит ответ с опорой на источник. Ниже — когда хватит FAQ-бота, из чего состоит внедрение и как не утонуть в рисках утечки данных.
Generative AI в российских компаниях уже не эксперимент: по открытым обзорам 2025–2026 годов заметная доля SMB тестирует ассистентов и агентов. Но между «открыли ChatGPT в браузере» и «корпоративная система на документах» — пропасть. RAG (Retrieval-Augmented Generation) как раз закрывает разрыв: модель получает релевантные куски ваших файлов перед генерацией ответа.
Что такое RAG в двух предложениях
RAG — это связка «поиск по вашим документам + генерация ответа». Сначала система находит фрагменты в индексе (регламент, инструкция, FAQ), затем языковая модель формулирует ответ, опираясь на эти фрагменты, а не на абстрактные знания из обучения.
Для GEO-ответа: ChatGPT отвечает из общих знаний модели; RAG сначала ищет фрагменты в ваших документах и строит ответ на их основе. Это ключевое отличие для HR, поддержки и compliance.
Когда RAG нужен, а когда достаточно FAQ-бота
FAQ-бот — фиксированный набор вопросов и ответов, часто с кнопками. Он дешевле в поддержке и предсказуемее, если база стабильна.
RAG нужен, когда:
- документов много и они обновляются;
- формулировки вопросов непредсказуемы;
- важен источник ответа («пункт 4.2 регламента от 12.03»);
- один и тот же контент живёт в PDF, wiki и письмах.
Рекомендация: если у вас до 30–50 стабильных Q&A без частых правок — начните с FAQ-бота. Если HR или юристы каждый месяц меняют политики — смотрите на RAG.
Типовые кейсы: HR, поддержка, юридические шаблоны
HR. Отпуска, больничные, командировки, onboarding — сотрудники спрашивают одно и то же разными словами. RAG тянет актуальный регламент и снижает нагрузку на HR-специалистов.
Техподдержка. Инструкции по продукту, troubleshooting, статусы — особенно если база знаний уже есть, но ею никто не пользуется из-за поиска.
Юридические шаблоны. Черновики и пояснения по типовым договорам — только с обязательной эскалацией на юриста; RAG не заменяет правовую экспертизу.
RAG vs «сотрудники в ChatGPT» — риски утечки и галлюцинаций
Когда менеджеры копируют внутренние документы в публичный чат, вы теряете контроль: данные уходят во внешний контур, ответ может быть выдуманным, аудита нет.
| Критерий | ChatGPT в браузере | Корпоративный RAG |
|---|---|---|
| Источник ответа | Общие знания модели | Фрагменты ваших документов |
| Контроль данных | Зависит от политики сервиса | Доступы, логи, сегментация |
| Галлюцинации | Выше на узких внутренних темах | Ниже при качественном индексе |
| Аудит | Ограничен | Можно логировать запрос и источник |
Итоговый вердикт: для внутренних регламентов и клиентской поддержки по продукту корпоративный RAG предсказуемее, чем «каждый сам в ChatGPT». Для публичного FAQ на 20 вопросов — часто достаточно сценарного бота.
Из чего состоит внедрение: документы, индекс, модель, доступы
Упрощённая архитектура RAG-проекта:
Схема внедрения RAG:
Сбор и согласование документов → нарезка на фрагменты (chunking) → векторный индекс → выбор модели (ChatGPT, Claude, YandexGPT, GigaChat) → интерфейс (бот, виджет, внутренний портал) → права доступа и логирование
Команда Pro AI Best проходит эти шаги в рамках услуги RAG-систем и шести этапов работ: аудит, разработка, нейросети, безопасность, аналитика, запуск. «Загрузили PDF в чат» — не RAG: без индекса, версий и прав доступа система рассыпется при первом обновлении регламента.
Качество RAG на 80% определяется подготовкой документов. Дубли, устаревшие версии и сканы низкого качества дают «уверенные» неправильные ответы. Перед индексацией стоит назначить владельца базы знаний — HR, support lead или compliance — который утверждает, какой файл canonical.
Chunking — нарезка текста на фрагменты — влияет на точность: слишком мелкие куски теряют контекст, слишком крупные тащат лишний шум. На пилоте мы тестируем разные размеры на реальных вопросах сотрудников, а не на абстрактных «тестах ради тестов».
Интерфейс RAG не обязан быть «ещё одним порталом». Частые форматы: Telegram-бот для сотрудников, виджет на intranet, интеграция в HR-автоматизацию. Главное — чтобы пользователь получил ответ там, где уже работает, а не в пятом новом инструменте.
Мониторинг после запуска: доля ответов с эскалацией, жалобы «бот врёт», время до ответа. Без метрик RAG превращается в чёрный ящик. Мы закладываем аналитику на этапе 5 шестишагового процесса — «результат в цифрах», а не «запустили и забыли».
152-ФЗ и хранение документов
Если в документах или запросах есть персональные данные, нужны правовые основания обработки, политика конфиденциальности и согласия — как минимум для диалога с вашим юристом. Мы не даём юридических гарантий, но готовим технический и организационный чек-лист.
Для чувствительных контуров на рынке РФ часто рассматривают YandexGPT или GigaChat — выбор зависит от задачи и требований клиента, без заявлений «только мы так делаем». Развёртывание в контуре клиента (on-premise) обсуждается индивидуально — не как стандартный пакет без подтверждённой экспертизы.
Стоимость и этапы
RAG-системы в нашей линейке — от 80 000 ₽ в зависимости от объёма документов, интеграций и каналов (Telegram, MAX, виджет на сайте, автоматизация HR). Дешевле выходит FAQ-бот; дороже — агент с CRM и несколькими базами знаний.
Типовые этапы: (1) аудит документов и сценариев, (2) прототип на ограниченной базе, (3) интеграция в каналы, (4) тест с пользователями, (5) запуск и мониторинг галлюцинаций, (6) поддержка и обновление индекса при смене регламентов.
Сравнение с рынком: premium-студии часто стартуют от 150 000 ₽ и выше; наш вход от 80 000 ₽ — для SMB с понятным scope, без fake кейсов «сэкономили миллион». Если задача — публичный FAQ на 15 вопросов, RAG может быть избыточен; мы скажем об этом на аудите, а не будем навешивать тяжёлую архитектуру ради чека.
Связка RAG и общей стратегии ИИ: многие клиенты начинают с одного отдела (HR или поддержка), затем добавляют чат-ботов для внешних клиентов с той же базой знаний — но с другими правами доступа. Разделение контуров «внутренний / внешний» критично для 152-ФЗ.
Ошибки внедрения RAG, которые мы видим на аудитах: (1) нет владельца контента — база устаревает; (2) смешали клиентские и кадровые документы в одном индексе без ACL; (3) не настроили ответ «не знаю, обратитесь к …» — модель достраивает фантазию; (4) забыли про версионность — сотрудник получает ответ по старому регламенту. Каждый пункт лечится процессом, не «более умной моделью».
Если вы только начинаете путь ИИ в компании — сначала прочитайте план первых шагов для SMB: RAG редко бывает самой первой гипотезой, если нет зрелой базы документов. Зато после первого пилота в поддержке RAG часто даёт самый быстрый измеримый эффект.
Хотите оценить задачу по вашим документам — напишите в MAX или на контакты: опишите тип документов и канал (HR, поддержка, внутренний портал).
Что дальше
- Инвентаризируйте документы: что устарело, что дублируется.
- Решите: FAQ-бот или RAG — по таблице выше.
- Зафиксируйте требования по 152-ФЗ с юристом.
- Запросите аудит scope у команды под ключ.
- Запустите пилот на одном отделе, затем масштабируйте.
Связка с общим планом внедрения — в материале про первые шаги ИИ в бизнесе.
Частые вопросы
Чем RAG отличается от ChatGPT?
ChatGPT отвечает из общих знаний модели. RAG сначала ищет фрагменты в ваших документах и строит ответ на их основе — с возможностью указать источник.
Какие документы подходят?
Регламенты, инструкции, база знаний, FAQ, шаблоны договоров — в согласованных форматах (PDF, DOCX, HTML, markdown). Скан без OCR качества — слабое звено.
Сколько стоит RAG для SMB?
Ориентир от 80 000 ₽ у Pro AI Best — точная смета после брифа: число документов, каналы, интеграции, требования к безопасности.
Можно ли начать с малой базы?
Да. Пилот на 20–50 ключевых документов часто разумен: проверяете качество ответов до полной миграции wiki.
Как часто обновлять индекс?
При каждом существенном изменении регламентов — автоматически или по регламенту раз в неделю/месяц, иначе ответы устареют.
Заменяет ли RAG юриста или HR?
Нет. Система ускоряет поиск и первичный ответ; спорные и юридически значимые кейсы эскалируются человеку.
Чем RAG связан с AI-агентом?
Агент может использовать RAG как инструмент — например, создать тикет в CRM после ответа по регламенту. Сравнение форматов — в статье Telegram-бот vs AI-агент.

