Главная
Словарь

Что такое RAG-система

СЛОВАРЬ

Что такое RAG-система

RAG (Retrieval-Augmented Generation) — архитектурный паттерн, в котором LLM (GPT-4, Claude) сначала ищет релевантные документы в вашей базе знаний (через векторный поиск), а затем генерирует ответ на основе найденного контекста. Это даёт точные ответы по внутренним данным компании, которых нет в обучающих наборах LLM.

Определение

RAG решает фундаментальную проблему LLM — они не знают вашу компанию, регламенты, документацию. Без RAG модели "галлюцинируют" — выдумывают ответы. С RAG они отвечают строго по предоставленным данным. Применение: внутренние чат-боты для поддержки, поиск по документам, юридические ассистенты, обучение новых сотрудников.

Как это работает

Архитектура RAG: 1) Документы (PDF, Notion, Confluence) разбиваются на чанки. 2) Каждый чанк прогоняется через embedding-модель (text-embedding-3) и сохраняется в векторную БД (Pinecone, Qdrant, pgvector). 3) При запросе пользователя — поиск похожих чанков по семантической близости. 4) Найденный контекст + вопрос подаются в LLM (GPT-4o, Claude 3.5). 5) Модель генерирует ответ строго по контексту.

Когда использовать

RAG подходит когда: нужно отвечать по внутренним документам (юридические регламенты, технические инструкции, политики HR), документация большая (нельзя поместить в prompt), требуется ссылка на источник ответа (compliance), нужна работа на нескольких языках.

Когда НЕ использовать

RAG не подходит когда: задачи требуют сложных математических расчётов (нужны function calling и tools), нужен творческий генеративный контент без привязки к фактам, данные меняются каждую секунду (RAG предполагает периодическую переиндексацию).

Связанные услуги WIZICO

Часто задаваемые вопросы

Нужна помощь с проектом?

Наши инженеры изучат вашу идею и предложат подходящий подход — аутсорсинг, аутстаффинг или разработку SaaS.

Обсудить проект
← Назад к словарю