Мурадов Юрий
Автор статьи
Мурадов Юрий Analyst SkillStat
Опубликовано 7 апреля 2026 г.
Обновлено 3 июня 2026 г.

RAG: что это, как работает retrieval-augmented generation и где он нужен

Retrieval-Augmented Generation — дополнение LLM внешними знаниями из базы данных/документов

Коротко о навыке

RAG нужен там, где модель должна отвечать не по памяти, а по документам. Система сначала ищет подходящие фрагменты во внешней базе знаний. Потом кладёт их в контекст и только после этого строит ответ. Так ответ становится ближе к реальным данным. И его легче проверить.

Поэтому главный вопрос в RAG не сводится к выбору модели. Важнее понять, какие тексты индексируются, как они режутся на фрагменты и почему поиск принёс именно эти куски. Нужно ещё видеть, что попало в ответ и что осталось за кадром. Именно там часто и сидит ошибка. Если здесь бардак, хороший LLM всё равно ответит плохо.

Что такое RAG

Что это

Подход, где модель сначала получает найденные фрагменты из документов, а потом отвечает по ним.

Где нужен

Базы знаний, поддержка, документация, поиск по договорам, каталоги и внутренние ассистенты.

Что даёт

Помогает работать с живыми и внутренними данными без постоянного переобучения модели.

Почему сильная модель всё равно ошибается

Если поиск нашёл лишние куски или пропустил нужный, модель уверенно склеит неверный ответ. Источник провала часто лежит в retrieval, а не в генерации.

Когда одного vector search мало

По смыслу можно найти похожий абзац, но промахнуться мимо точного артикула, номера договора или версии регламента. Поэтому на практике часто добавляют фильтры, BM25 или reranking.

Зачем нужны ссылки на источник

Они помогают проверить ответ и быстро понять, где возникла ошибка. Иногда виноват документ. Иногда поиск. Иногда сама модель.

Механика / Работа

Как проходит путь от документа до ответа в RAG

У RAG есть понятная цепочка. Сначала документы готовят и кладут в индекс. Потом система ищет нужные куски. И только после этого модель получает контекст для ответа.

Шаг 01
Слой

Документы приводят в порядок

Смысл

Тексты очищают, режут на фрагменты и сохраняют метаданные, которые потом пригодятся для фильтров.

Шаг 02
Слой

Фрагменты попадают в индекс

Смысл

Их делают доступными для поиска по словам, по embedding или гибридным способом.

Шаг 03
Слой

Запрос ищет кандидатов

Смысл

Retriever достаёт несколько подходящих кусков, а система может дополнительно их пересортировать.

Шаг 04
Слой

Контекст собирают в промпт

Смысл

Вопрос и найденные фрагменты передают модели в одном окне контекста.

Шаг 05
Слой

Ответ сверяют с источником

Смысл

Хорошая система умеет показать, откуда взялась информация и где искать причину ошибки.

Навык / Применение

Где используется RAG

RAG полезен там, где люди задают вопрос обычным языком, а ответ должен опираться на реальный набор документов. Особенно это заметно в быстро меняющейся базе знаний.

Сценарий 01

Внутренняя база знаний

Сотрудник спрашивает про регламент, а система вытаскивает нужный фрагмент из инструкций и политик.

Сценарий 02

Поддержка и service desk

Оператор или бот опирается на FAQ, документацию и историю похожих случаев.

Сценарий 03

Поиск по договорам и архиву

RAG помогает найти нужный пункт и пересказать его без долгого ручного чтения.

Сценарий 04

Продуктовые и аналитические ассистенты

Ответы строятся по каталогу, базе знаний или описанию внутренних процессов.

По направлениям

RAG заметен в 4 направлениях рынка с долей выше 5%.

Направление Контекст Доля Вакансии
Данные и ML
Трансформации, ETL и подготовка датасетов.
49.7%
732
Разработка
Схема БД, запросы приложения и разбор производительности.
24.4%
359
Аналитика
Запросы, метрики, витрины и быстрые ответы по данным.
9%
133
Менеджмент
Самостоятельная проверка показателей и продуктовых гипотез.
7.6%
112
Направления показывают, в каких частях IT-рынка навык заметен чаще всего, без разбивки по ролям.
Инструмент / Возможности

Что должен уметь специалист по RAG

Рабочий уровень здесь видно не по набору модных слов. Он виден по тому, как человек разбирает плохой ответ и объясняет, на каком шаге цепочка дала сбой.

Готовить корпус

Понимать, какие документы годятся для поиска и как их лучше дробить.

Проверять retrieval

Разбирать, какие фрагменты попали в контекст и почему именно они.

Собирать понятный промпт

Ограничивать шум, задавать формат ответа и просить модель ссылаться на источник.

Измерять качество

Сравнивать ответы на одном наборе вопросов, а не по случайным демонстрациям.

Разводить причины ошибок

Отделять проблему данных, поиска, reranking и генерации друг от друга.

Сравнение / Контекст

Основные термины RAG без путаницы

Большая часть путаницы появляется на базовых словах. Если их не развести, дальше трудно понять, что именно вы настраиваете и почему ответ меняется.

Chunk

Chunk — это фрагмент документа, который система ищет и кладёт в контекст. Он должен содержать цельную мысль.

Embedding

Embedding — числовое представление текста, по которому ищут похожие по смыслу фрагменты.

Retriever

Retriever — слой поиска, который выбирает кандидатов для ответа до генерации.

Reranker

Reranker — дополнительный шаг, который пересортировывает найденные куски и поднимает более точные выше.

Данные / Стек

Где в RAG чаще всего ломается качество

Плохой ответ редко появляется в одной точке. Обычно он собирается по цепочке: документ, нарезка, индекс, поиск, фильтр, контекст и инструкция к ответу.

Документы

Устаревшие или противоречивые тексты дают слабый ответ даже сильной модели.

Нарезка на фрагменты

Слишком короткие или случайные куски рвут мысль и ломают контекст.

Метаданные и фильтры

Без них система может вытянуть старую версию документа или не тот раздел.

Окно контекста

Если в промпт положили лишнее, нужный фрагмент может просто потеряться.

Сравнение / Инструменты

RAG, полнотекстовый поиск и fine-tuning

Эти подходы часто смешивают, хотя они решают разные задачи. Сравнивать их проще по тому, что именно вы хотите улучшить в системе.

Инструмент За что отвечает Когда нужен Граница

RAG

Связывает поиск по документам и ответ модели в одной цепочке.

Нужен, когда знания живут во внешних текстах и быстро меняются.

Не спасает, если документы грязные, а retrieval плохо настроен.

Полнотекстовый поиск

Ищет по словам, фразам и точным совпадениям без генерации ответа.

Подходит, когда важны термин, код, артикул или короткий документ.

Сам по себе не перескажет найденное и не склеит ответ пользователю.

Fine-tuning

Меняет поведение модели на типовом наборе обучающих примеров.

Нужен, когда важно скорректировать стиль, формат или устойчивую реакцию.

Не решает задачу живых документов, которые обновляются каждый день.

Гибридный подход

Сочетает поиск по словам, embeddings, фильтры и reranking.

Подходит, когда в запросах есть и смысл, и точные поля или версии.

Становится сложнее в поддержке, если команда не меряет вклад каждого слоя.

Карьера / Роли

Карьерные треки с RAG

RAG переносится между ролями: Data Scientist, AI-инженер, ML-инженер. В одном треке этот навык может быть основным рабочим инструментом, а в другом - сильным прикладным усилителем основной специализации.

Роли с навыком

Data Scientist держит 76.1% вакансий по навыку.

Роль Вакансии Медиана
Data Scientist
226
AI-инженер
192
ML-инженер
192
Python-разработчик
190
Системный аналитик
76
Backend-разработчик
43
Инженер данных
43

Ещё 7 ролей используют RAG

Практика / Задачи

Частые задачи с RAG

RAG ценен не абстрактным знанием инструмента, а повторяющимися рабочими задачами: быстро получить ответ, проверить расхождение, подготовить рабочий слой для команды и довести решение до результата.

Задача 01
Задача

Подготовить документы к индексации

Что делает специалист

Очистить шум, сохранить метаданные и нарезать материалы на полезные куски.

Задача 02
Задача

Настроить retrieval

Что делает специалист

Проверить, какие фрагменты система реально кладёт в контекст по рабочим вопросам.

Задача 03
Задача

Ввести оценку качества

Что делает специалист

Замерить точность поиска, полноту ответа и устойчивость на наборе тестовых вопросов.

Задача 04
Задача

Разобрать плохой ответ

Что делает специалист

Понять, ошибся документ, поиск, reranking, промпт или сама модель.

Рынок / Контекст

Почему RAG востребован

RAG ценят за очень практичную вещь: он даёт модели доступ к текущим документам без нового обучения на каждом изменении. Поэтому навык нужен командам, где ответ должен опираться на инструкции, карточки, статьи, договоры или внутренние правила. Рабочая ценность специалиста здесь не в красивой схеме. Она в умении собрать весь путь от документа до ответа и объяснить, где система теряет точность. Именно это отличает демо от системы, которую можно поддерживать в работе. И которую не страшно показать бизнесу. И не стыдно разбирать на реальных ошибках. Команда быстрее понимает, что чинить дальше. Это видно уже на первых пилотах.

Даёт быстрый ответ по данным

RAG нужен там, где важно быстро проверить гипотезу, сверить метрику или подготовить данные для следующего шага.

Работает в нескольких ролях

Такой навык редко живёт в одной профессии: он остаётся полезным в аналитике, продукте, разработке и соседних data-сценариях.

Остаётся частью базового слоя

Инструменты вокруг меняются, но сама задача не исчезает, поэтому RAG продолжает удерживать прикладной спрос.

Сигнал рынка
Стабильный спрос

RAG формирует устойчивый спрос внутри своего рабочего сегмента.

Рынок / Спрос

Спрос на RAG на рынке

RAG сохраняет устойчивый прикладной спрос на рынке: 297 активных вакансий, #59 по рынку, 3.8% IT-вакансий. Ниже показано число открытых вакансий на конец каждого месяца: это исторический ряд по состоянию на конец месяца, а не текущий срез рынка на сегодня.

Сила спроса
Стабильный спрос
297
активных вакансий сейчас

#59 по рынку • 3.8% IT-вакансий

Месяц к месяцу
379
июнь 2026

+9 вакансий и +2% к предыдущему месяцу.

Доход / Уровни

Сколько платят специалистам с RAG

Рынку нужен специалист, который умеет разбирать качество ответа по этапам. Сначала он смотрит на данные. Потом проверяет retrieval и reranking. После этого смотрит на метрики и плохие кейсы на повторяемом наборе вопросов. Такой специалист...

Медиана рынка
Ограниченная точность
282 000
₽ / месяц

38 активных вакансий с зарплатой • покрытие 12.2% зарплатной выборки

Коридор по грейдам
publishable уровни

Коридор появится с publishable-грейдами.

Основной уровень
Senior
по структуре рынка

Senior - основной уровень рынка (51%)

Вход / Старт

Порог входа

Сейчас на рынке 10 активных junior-вакансий с RAG. Это 3.8% всех вакансий по навыку, поэтому для старта важнее всего смотреть на реальный объём junior-окна и на стек, который рынок ждёт рядом.

Junior-вакансии сейчас
10
активных вакансий

3.8% всех вакансий по навыку • Senior / Junior 13.4x

Доля junior
3.8%
% всех вакансий по навыку

Окно входа узкое: рынок чаще нанимает с опытом.

Что нужно на старте

Стартовый стек

14
навыков в медианной вакансии

Медианная вакансия с RAG ожидает около 14 навыков в стеке. Это собранный стартовый набор: рынок обычно ищет не один изолированный инструмент, а рабочую комбинацию соседних навыков.

Чаще всего требуют вместе

навыки из junior-вакансий, где встречается RAG

Навык Junior-вакансии
Связи / Навыки

Навыки в связке с RAG

RAG редко живёт изолированно: чаще всего рынок видит его рядом с LLM, Python, Docker. Самая плотная связка сейчас - LLM: оба навыка встречаются вместе в 93% вакансий.

Главная связка: LLM • 93% вакансий. Показываем общерыночные связки RAG: не junior-минимум из блока выше, а навыки, которые чаще всего встречаются рядом с ним в одной вакансии.

Рабочий стек вокруг RAG

навыки, которые рынок чаще всего видит рядом в одной вакансии

Навык Зачем рядом Доля
LLM
Одна из самых плотных рыночных связок рядом с RAG.
93%
Часто встречается рядом с RAG в одном рабочем сценарии.
80%
Часто встречается рядом с RAG в одном рабочем сценарии.
50%
Поддерживает соседние процессы и усиливает рабочий контур навыка.
49%
Поддерживает соседние процессы и усиливает рабочий контур навыка.
48%
SQL
Поддерживает соседние процессы и усиливает рабочий контур навыка.
37%

Связки, которые усиливают доход

не базовый минимум, а более сильные комбинации стека

1
LLM
n = 31
+2% 287 000 ₽
Обучение / Маршрут

Как изучить RAG

Учить RAG лучше на маленьком корпусе, где заранее известны правильные ответы. Сначала полезно настроить обычный поиск по текстам и посмотреть, какие фрагменты вообще находятся. Потом добавить embeddings, reranking и только после этого подключить модель. Такой порядок быстро показывает, что проблема часто сидит не в LLM, а в документе, нарезке и ранжировании. Ещё он учит не прятать плохой retrieval за красивым текстом модели. А значит, быстрее приводит к рабочей диагностике. Полезно ещё вести заметки по каждому провалу. И сохранять примеры хорошей выдачи рядом. Без этого сложнее честно сравнивать изменения в системе. И сложнее ловить регресс.

Этап 01
Фокус

Собрать маленький корпус

Что изучать

Взять понятный набор документов и выписать вопросы, на которые в них точно есть ответ.

Этап 02
Фокус

Проверить поиск без модели

Что изучать

Сначала важно увидеть, какие куски система вообще поднимает по запросу.

Этап 03
Фокус

Подключить модель к найденным фрагментам

Что изучать

Сравнить хороший и плохой контекст на одном и том же вопросе.

Этап 04
Фокус

Добавить оценку качества

Что изучать

Сравнивать результаты на фиксированном наборе вопросов, а не по красивой демо-сцене.

Практика / Первый запуск

С чего начать RAG на практике

Соберите небольшой корпус документов и десять вопросов с известным ответом. Сначала добейтесь внятного поиска без генерации. Потом добавьте модель, ссылки на источники и простой набор метрик. Полезно сохранять и удачные, и плохие кейсы отдельно. Потом сравнивать их рядом. И не менять сразу все настройки. Полезно идти по одному шагу за раз. И записывать, что именно поменялось. И почему вы сделали этот шаг. Полезно ещё отмечать, что не сработало. И что дало эффект. Такой маршрут быстрее всего показывает настоящие слабые места системы.

Шаг 01

Выбрать один корпус документов

Не смешивать сразу договоры, статьи и логи в одном эксперименте.

Шаг 02

Подготовить контрольные вопросы

Они пригодятся для сравнения retrieval и итогового ответа на одинаковых кейсах.

Шаг 03

Сначала настроить поиск

Проверить, какие фрагменты вообще находятся без участия модели.

Шаг 04

Потом подключить генерацию

Добавить формат ответа, ссылки на источник и разбор типовых провалов.

Старт / Документация

Полезные материалы

Для навыка RAG важнее не установка, а понятные источники и материалы, которые помогают быстрее разобраться в теме.

Не путать с

RAG важно отделять от соседних инструментов и ролей, чтобы не путать сам навык с окружением вокруг него.

Первый практический шаг

Первый практический шаг по RAG должен быть коротким и проверяемым: один сценарий, один результат, один понятный вывод.

Что открыть дальше

После короткого объяснения переходите к официальной документации, одному туториалу и одному живому примеру по RAG.

Будущее / Роль

Перспективы RAG

Перспективы RAG завязаны не только на текущем спросе, но и на том, как навык встраивается в новые платформы, инструменты и рабочие контуры.

Сигнал 01

Оценка качества станет ещё важнее

Команды всё чаще смотрят не на демо, а на повторяемые метрики и тестовые вопросы.

Сигнал 02

Гибридный поиск останется нормой

Чистого vector search часто мало, поэтому фильтры, BM25 и reranking никуда не уйдут.

Сигнал 03

Данные останутся главным узким местом

Побеждает не тот, кто первым подключил LLM, а тот, кто держит документы и индекс в порядке.

Частые вопросы

Вопросы и ответы

RAG и чат-бот — это одно и то же?

Нет. Чат-бот — это форма интерфейса. RAG — это способ дать модели внешний контекст из документов перед ответом. Один и тот же бот может работать с RAG, а может отвечать и без него. Это разные уровни системы.

RAG всегда лучше fine-tuning?

Нет. Если документы часто меняются, RAG обычно удобнее. Если нужно изменить стиль, формат или устойчивое поведение модели на типовых примерах, может понадобиться fine-tuning. Часто команды сочетают оба подхода, а не выбирают только один. Это нормальный рабочий сценарий.

Нужна ли векторная база для любого RAG?

Не всегда. Иногда хватает полнотекстового или гибридного поиска. Всё зависит от данных, типа вопросов и того, насколько важны точные термины, версии и фильтры. Векторная база — это частый, но не обязательный слой. Иногда она вообще не нужна.

Почему система отвечает уверенно, но неверно?

Обычно в контекст попал не тот фрагмент, источник устарел или модель склеила вывод из частично подходящих кусков. Поэтому нужно смотреть и на документ, и на retrieval, и на итоговый промпт. Ошибка редко живёт только в одном месте.

С чего начать обучение RAG?

С маленькой базы документов и набора вопросов с известным ответом. Сначала настройте поиск без LLM. Потом добавьте генерацию, ссылки на источники и простую проверку качества. Такой маршрут быстрее даёт понимание, где система действительно слаба. И не даёт спрятаться за красивую демо-выдачу.

Что в RAG ломают чаще всего?

Чаще всего провал начинается с документов и нарезки. Потом добавляются слабые фильтры, плохой retrieval и лишний шум в контексте. Поэтому разбирать систему полезно не с модели, а с более ранних слоёв. Там и лежит главная причина. Это видно почти в каждом разборе.