Мурадов Юрий
Автор статьи
Мурадов Юрий Analyst SkillStat
Опубликовано 7 апреля 2026 г.
Обновлено 3 июня 2026 г.

DWH: что это, как устроено хранилище данных и чем отличается от Data Lake

Data Warehouse — централизованное хранилище структурированных данных для аналитики и отчётности

Коротко о навыке

DWH, или хранилище данных, собирает данные из разных систем в одно аналитическое место. Здесь показатели приводят к общей модели, проверяют и отдают в отчёты, витрины и BI.

Главная мысль проста: рабочая база хранит операции, а DWH хранит историю и согласованные расчёты. Именно поэтому один и тот же показатель должен считаться одинаково для разных команд.

Сильный уровень в DWH виден по умению объяснить путь метрики от источника до строки в дашборде. И быстро найти место, где она исказилась. А ещё понять, почему цифра изменилась задним числом. Это и отличает хранилище от набора выгрузок.

Что такое DWH

Что это

Аналитическое хранилище с единой моделью показателей.

Где нужен

BI, отчётность и финансы.

Что даёт

Даёт общие метрики и путь данных.

Как работает DWH

DWH работает как цепочка. Источник отдаёт данные, загрузка переносит их в промежуточный слой, правила очищают значения, а витрина делает данные удобными для отчёта.

DWH и смежные подходы

DWH живёт рядом с ETL, ELT, Data Lake, BI, каталогом данных и средствами контроля качества. Хороший уровень виден в умении объяснить, какой слой за что отвечает, а не в перечислении названий инструментов.

Что входит в базовую практику DWH

Базовая практика — это маленькая, но законченная схема. Источник заказов, таблица фактов, измерения, проверка качества, витрина и отчёт уже дают рабочий пример.

Механика / Работа

Как данные проходят путь до DWH

Путь данных в DWH обычно начинается с источника и заканчивается строкой в отчёте. Между ними есть загрузка, очистка, согласование ключей, модель фактов и измерений и витрина для конкретного вопроса. Ошибки бывают на каждом шаге. Источник может поменять статус, загрузка может пропустить строки, а витрина — задвоить суммы. Поэтому в DWH важно проверять всю цепочку, а не только финальный SQL.

Шаг 01
Слой

Источники

Смысл

Сначала определяют, откуда приходят данные: рабочие базы, CRM, ERP, файлы, события, внешние сервисы и ручные справочники.

Шаг 02
Слой

Загрузка

Смысл

Данные забирают по расписанию или событию. Важно понимать полную и инкрементальную загрузку, задержку и повторный запуск после ошибки.

Шаг 03
Слой

Очистка и согласование

Смысл

На этом слое проверяют типы, дубли, пропуски, ключи, единицы измерения и соответствие справочников.

Шаг 04
Слой

Модель хранилища

Смысл

Факты описывают события и числа, измерения дают контекст. История помогает сравнивать показатели во времени.

Шаг 05
Слой

Витрины

Смысл

Для аналитиков и отчётов готовят удобные таблицы, где уже согласованы бизнес-правила и нужная гранулярность.

Шаг 06
Слой

Потребление

Смысл

BI, аналитики, продукты и руководители используют витрины. Здесь особенно важны документация метрик и контроль доступа.

Навык / Применение

Где используется DWH

DWH особенно полезен там, где отчёты уже влияют на деньги, планирование и операционные решения, а ручные Excel-выгрузки дают разные ответы на один и тот же вопрос.

Сценарий 01

Хранение и вычисления

Для истории, агрегатов и тяжёлых аналитических запросов.

Сценарий 02

Связь с пайплайном

Связан с загрузками, качеством и BI.

Сценарий 03

Надёжность под нагрузкой

Должен переживать ночные загрузки и пересчёты.

Сценарий 04

Рост платформы

Помогает развивать одну модель данных.

По направлениям

DWH заметен в 5 направлениях рынка с долей выше 5%.

Направление Контекст Доля Вакансии
Аналитика
Запросы, метрики, витрины и быстрые ответы по данным.
45.3%
695
Данные и ML
Трансформации, ETL и подготовка датасетов.
33.6%
516
Архитектура
Часть спроса по навыку сосредоточена в этом направлении.
5.3%
82
Инфраструктура
Диагностика БД и служебные рабочие запросы.
5.1%
78
Направления показывают, в каких частях IT-рынка навык заметен чаще всего, без разбивки по ролям.
Инструмент / Возможности

Что входит в рабочий навык DWH

В рабочий навык входят модель данных, загрузки, история изменений, проверки качества, витрины и понимание того, кто владеет метрикой. Без этого хранилище быстро превращается в склад таблиц.

Модель данных

Нужно понимать факты, измерения, ключи, гранулярность, историю и связь между витринами.

Загрузки

ETL и ELT должны быть повторяемыми: с расписанием, журналами, обработкой ошибок и понятным восстановлением.

Качество данных

Проверяют дубли, пропуски, диапазоны, контрольные суммы, количество строк и расхождения с источником.

Производительность

Запросы должны укладываться в рабочее время отчётов. На это влияют модель, партиции, индексы, объём и движок.

Метрики

Выручка, активный клиент или остаток должны иметь одно описание, иначе разные команды получают разные цифры.

Доступ

Хранилище часто содержит чувствительные данные, поэтому нужны роли, ограничения, аудит и понятные правила публикации.

Сравнение / Контекст

DWH, Data Lake, Lakehouse и OLTP-база: в чём разница

DWH нужен для согласованных показателей и истории. Data Lake чаще хранит сырой слой файлов и событий. Lakehouse пытается совместить оба подхода. OLTP-база обслуживает операции приложения. Проблемы начинаются, когда эти роли смешивают. Тогда отчёт считают прямо на рабочей базе, а команда снова спорит, почему цифры не сходятся.

DWH

Согласованный аналитический слой для отчётности, витрин, истории и управленческих показателей.

Data Lake

Более сырой слой хранения для файлов, событий и разноформатных данных, где структура может появляться позже.

Lakehouse

Подход, который пытается совместить хранение в озере с управляемыми таблицами, транзакционностью и аналитическими запросами.

OLTP-база

Рабочая база приложения, оптимизированная под операции, транзакции и текущие данные, а не под долгие аналитические запросы.

Данные / Стек

Что проверять в DWH перед доверием к отчёту

Перед тем как доверять отчёту, проверьте источник, время последней загрузки, гранулярность факта и правила фильтрации. Отдельно смотрят ключи соединения, дубли, пропуски и то, как учитываются возвраты, отмены и ручные правки. Если речь идёт о выручке, важно сразу знать, какая дата считается главной и из какого источника берётся оплата. Без этого красивый дашборд остаётся спорной цифрой.

Свежесть

Проверяют, когда источник был загружен и не отстал ли отчёт от реальной операции.

Гранулярность

Нужно знать, что означает одна строка: заказ, позиция заказа, день, клиент, платёж или агрегат.

Ключи

Неверный ключ соединения может задвоить строки или потерять часть данных без видимой ошибки.

История

Важно понимать, как хранится изменение клиента, цены, статуса или организационной структуры.

Метрика

Показатель должен иметь владельца, формулу, фильтры и понятные исключения.

Права

Пользователь отчёта должен видеть только допустимые данные, особенно в финансовых и персональных витринах.

Сравнение / Инструменты

DWH, Data Lake, Lakehouse, витрина и BI: что выбрать

Выбор зависит от зрелости данных, скорости изменений, требований к истории, стоимости хранения, привычек команды и того, кто будет пользоваться результатом. DWH подходит для устойчивых показателей и отчётности, озеро — для сырого слоя и экспериментов, витрина — для конкретного потребителя, BI — для визуализации и анализа поверх подготовленных данных. В зрелой архитектуре эти слои не спорят друг с другом. Сырой слой помогает не потерять исходные данные, DWH задаёт согласованную модель, витрина отвечает за удобство конкретной команды, а BI показывает результат. Проблемы начинаются, когда один слой пытаются использовать вместо всех остальных.

Инструмент За что отвечает Когда нужен Граница

DWH

Единое хранилище подготовленных данных для отчётности, аналитики и устойчивых метрик.

Нужно, когда компания хочет одну версию показателей, историю и регулярные отчёты для разных команд.

Не заменяет сырой слой и не должен принимать любую непроверенную выгрузку без правил качества.

Data Lake

Слой для хранения сырых или полуобработанных данных в разных форматах.

Полезен для больших объёмов, экспериментов, событий и сценариев, где модель ещё меняется.

Без каталога, качества и владельцев быстро превращается в склад файлов без доверия.

Lakehouse

Архитектура на стыке озера и хранилища с управляемыми таблицами поверх файлового слоя.

Подходит, когда нужны гибкость озера, SQL-аналитика и более единый контур для инженеров и аналитиков.

Не отменяет моделирование, качество данных и договорённости о метриках.

Витрина

Подготовленный набор данных под конкретный отчёт, команду или продуктовый сценарий.

Нужна, когда потребителю требуется быстрый и понятный слой без сложной логики источников.

Если витрины строятся каждая по своим правилам, компания снова получает разные версии показателей.

BI

Слой визуализации, исследования данных и дашбордов для пользователей.

Уместен после подготовки данных и согласования метрик.

Не исправляет плохое хранилище: красивый график может показывать неверную бизнес-логику.

Карьера / Роли

Карьерные треки с DWH

DWH переносится между ролями: Инженер данных, BI-аналитик, Аналитик данных. В одном треке этот навык может быть основным рабочим инструментом, а в другом - сильным прикладным усилителем основной специализации.

Роли с навыком

Инженер данных держит 139.5% вакансий по навыку.

Роль Вакансии Медиана
Инженер данных
452
BI-аналитик
331
Аналитик данных
177
Системный аналитик
99
Архитектор данных
58
Бизнес-аналитик
48
Продуктовый аналитик
40
DevOps-инженер
36

Ещё 7 ролей используют DWH

Практика / Задачи

Частые задачи с DWH

DWH ценен не абстрактным знанием инструмента, а повторяющимися рабочими задачами: быстро получить ответ, проверить расхождение, подготовить рабочий слой для команды и довести решение до результата.

Задача 01
Задача

Разложить задачу на модель

Что делает специалист

Перевести вопрос бизнеса в модель данных.

Задача 02
Задача

Согласовать границы решения

Что делает специалист

Разделить сырой слой, хранилище, витрину и BI.

Задача 03
Задача

Проверить качество идеи

Что делает специалист

Проверить гранулярность, историю и понятность метрики.

Задача 04
Задача

Подготовить рабочий артефакт

Что делает специалист

Описать модель, загрузку и владельца показателя.

Задача 05
Задача

Сопоставить модель с реальной системой

Что делает специалист

Сверить схему с источниками и расписанием.

Задача 06
Задача

Обновить подход после изменений

Что делает специалист

Обновить модель после изменения процесса.

Рынок / Контекст

Почему DWH востребован

DWH нужен компаниям, где данные приходят из нескольких систем, а бизнес ждёт один ответ по выручке, клиентам или остаткам. Если у каждой команды своя выгрузка, споры о цифрах появляются быстро. Поэтому работодатели ищут людей, которые умеют не просто строить таблицы. Важнее понять гранулярность, договориться о правилах расчёта, проверить загрузку и показать, откуда взялся показатель. Именно это делает хранилище рабочим инструментом, а не складом выгрузок. И снижает число споров о метриках. Чаще всего именно отсюда и появляется спрос. Без такой роли цифры быстро расползаются. И красивая схема уже не спасает. Это чувствует и бизнес.

Даёт быстрый ответ по данным

DWH нужен там, где важно быстро проверить гипотезу, сверить метрику или подготовить данные для следующего шага.

Работает в нескольких ролях

Такой навык редко живёт в одной профессии: он остаётся полезным в аналитике, продукте, разработке и соседних data-сценариях.

Остаётся частью базового слоя

Инструменты вокруг меняются, но сама задача не исчезает, поэтому DWH продолжает удерживать прикладной спрос.

Сигнал рынка
Стабильный спрос

DWH формирует устойчивый спрос внутри своего рабочего сегмента.

Рынок / Спрос

Спрос на DWH на рынке

DWH сохраняет устойчивый прикладной спрос на рынке: 324 активных вакансий, #52 по рынку, 4.2% IT-вакансий. Ниже показано число открытых вакансий на конец каждого месяца: это исторический ряд по состоянию на конец месяца, а не текущий срез рынка на сегодня.

Сила спроса
Стабильный спрос
324
активных вакансий сейчас

#52 по рынку • 4.2% IT-вакансий

Месяц к месяцу
395
июнь 2026

+8 вакансий и +2% к предыдущему месяцу.

Доход / Уровни

Сколько платят специалистам с DWH

DWH редко оценивают отдельно от роли, но он заметно усиливает инженера данных, BI-аналитика и архитектора. Выше ценят тех, кто может быстро найти расхождение в метрике, объяснить его бизнесу и вернуть отчёт в рабочее состояние. Такой навык...

Медиана рынка
Ограниченная точность
250 000
₽ / месяц

40 активных вакансий с зарплатой • покрытие 11.8% зарплатной выборки

Коридор по грейдам
publishable уровни

Коридор появится с publishable-грейдами.

Основной уровень
Senior
по структуре рынка

Senior - основной уровень рынка (58%)

Вход / Старт

Порог входа

Сейчас на рынке 22 активных junior-вакансий с DWH. Это 8.4% всех вакансий по навыку, поэтому для старта важнее всего смотреть на реальный объём junior-окна и на стек, который рынок ждёт рядом.

Junior-вакансии сейчас
22
активных вакансий

8.4% всех вакансий по навыку • Senior / Junior 6.9x

Доля junior
8.4%
% всех вакансий по навыку

Вход возможен, но рынок ждёт уже собранный стартовый стек.

Что нужно на старте

Стартовый стек

12
навыков в медианной вакансии

Медианная вакансия с DWH ожидает около 12 навыков в стеке. Это собранный стартовый набор: рынок обычно ищет не один изолированный инструмент, а рабочую комбинацию соседних навыков.

Чаще всего требуют вместе

навыки из junior-вакансий, где встречается DWH

Навык Junior-вакансии
SQL
22
15
Apache Airflow
11
Apache Spark
9
ETL
9
8
Связи / Навыки

Навыки в связке с DWH

DWH редко живёт изолированно: чаще всего рынок видит его рядом с SQL, Python, ETL. Самая плотная связка сейчас - SQL: оба навыка встречаются вместе в 87% вакансий.

Главная связка: SQL • 87% вакансий. Показываем общерыночные связки DWH: не junior-минимум из блока выше, а навыки, которые чаще всего встречаются рядом с ним в одной вакансии.

Рабочий стек вокруг DWH

навыки, которые рынок чаще всего видит рядом в одной вакансии

Навык Зачем рядом Доля
SQL
Одна из самых плотных рыночных связок рядом с DWH.
87%
Часто встречается рядом с DWH в одном рабочем сценарии.
61%
ETL
Часто встречается рядом с DWH в одном рабочем сценарии.
52%
Поддерживает соседние процессы и усиливает рабочий контур навыка.
41%
Поддерживает соседние процессы и усиливает рабочий контур навыка.
38%
Поддерживает соседние процессы и усиливает рабочий контур навыка.
35%
Обучение / Маршрут

Как изучить DWH

Начните с одного показателя, например выручки. Возьмите источник заказов, источник оплат и справочник клиентов. Затем зафиксируйте гранулярность, соберите факт, добавьте измерения и сделайте простую витрину. После этого проверьте качество: дубли, пустые ключи, отмены, частичные оплаты и задержку загрузки. Такой путь быстрее показывает смысл DWH, чем схема со слоями без живой метрики. Полезно сразу сверить результат с эталонным отчётом или ручной выборкой. Тогда ошибки всплывают раньше. И становится понятнее цена договорённостей. Ещё полезно зафиксировать владельца метрики. Это дисциплина, а не декор. Так модель взрослеет быстрее. И не рассыпается на спорных кейсах.

Этап 01
Фокус

Базовые определения

Что изучать

Понять разницу между операционной базой, хранилищем, витриной, озером данных, Lakehouse, фактом, измерением и показателем.

Этап 02
Фокус

Примеры применения

Что изучать

Разобрать продажи, остатки, активных клиентов или финансовый отчёт, где одно число собирается из нескольких источников.

Этап 03
Фокус

Связь с реальным проектом

Что изучать

Связать требования бизнеса с источниками, ключами, историей, проверками качества и формулой показателя.

Этап 04
Фокус

Практика на живых сценариях

Что изучать

Собрать маленькую витрину, сверить её с источником, описать ограничения и показать, как отчёт переживает повторную загрузку.

Практика / Первый запуск

Как начать с DWH на практике

Соберите маленькое хранилище на одном сценарии: заказы, оплаты, клиенты и витрина по выручке. Сначала зафиксируйте гранулярность и правила расчёта, потом проверьте дубли, отмены и задержку загрузки. Следующий полезный шаг — добавить историю изменения клиента или товара и пересчитать старый период. После этого сразу видно, зачем DWH хранит не только текущее состояние. Именно здесь появляется ощущение живой аналитической модели, а не учебной схемы. И становится понятнее цена ошибки. После этого легче увидеть реальную пользу слоя. И проверить, как ведёт себя пересчёт. Сразу сравните старые периоды.

Шаг 01

Выбрать один показатель

Например, выручку, активных клиентов или остатки. Показатель должен иметь понятный источник и владельца.

Шаг 02

Описать источники

Зафиксируйте таблицы, файлы, поля, ключи, расписание обновления и возможные ручные правки.

Шаг 03

Собрать модель

Разделите факты и измерения, определите гранулярность строк и правила истории.

Шаг 04

Сделать загрузку

Пусть даже простую: важно оставить журнал запуска, проверки строк и понятный повтор после ошибки.

Шаг 05

Построить витрину

Соберите таблицу для отчёта и проверьте показатель на нескольких контрольных примерах.

Старт / Документация

Полезные материалы

Для навыка DWH важнее не установка, а понятные источники и материалы, которые помогают быстрее разобраться в теме.

Не путать с

DWH важно отделять от соседних инструментов и ролей, чтобы не путать сам навык с окружением вокруг него.

Первый практический шаг

Первый практический шаг по DWH должен быть коротким и проверяемым: один сценарий, один результат, один понятный вывод.

Что открыть дальше

После короткого объяснения переходите к официальной документации, одному туториалу и одному живому примеру по DWH.

Будущее / Роль

Перспективы DWH

Перспективы DWH завязаны не только на текущем спросе, но и на том, как навык встраивается в новые платформы, инструменты и рабочие контуры.

Сигнал 01

DWH останется основой доверенной аналитики

Даже при росте Lakehouse нужна зона с проверенными показателями.

Сигнал 02

Сильнее станет связка с качеством данных

Рынок будет выше ценить специалистов, которые умеют построить таблицу и доказать свежесть, полноту и корректность данных.

Сигнал 03

Роль DWH будет шире простой отчётности

Хранилища всё чаще кормят аналитику, риск-модели и ML.

Частые вопросы

Вопросы и ответы

Что такое DWH простыми словами?

DWH — это место, где данные из разных систем приводят к общей аналитической модели. Затем на этой модели строят витрины, отчёты и показатели, которым можно доверять. Главная ценность здесь именно в согласованных правилах расчёта. И в понятной истории изменения данных.

Для каких задач нужен DWH?

Он нужен для регулярной отчётности, BI, исторических данных и метрик, которые считают сразу из нескольких источников. Чаще всего речь идёт о выручке, клиентах, остатках, заказах и продуктовых показателях. Без хранилища такие цифры быстро расходятся между командами.

В чём главный смысл хранилища данных?

Не просто собрать таблицы в одной базе, а договориться о правилах расчёта. DWH помогает понять, какая строка считается фактом, какая дата главная и кто отвечает за определение метрики. Без этого одинаковые на вид отчёты начинают спорить друг с другом.

С чего лучше начать изучение DWH?

Самый понятный старт — один показатель и полный путь данных. Возьмите источник заказов, источник оплат, соберите факт, добавьте измерения и проверьте, как витрина переживает дубли, отмены и пересчёт. Так теория быстро превращается в проверяемую практику. И становится ближе к реальной работе.

Чем DWH отличается от Data Lake?

DWH хранит согласованную аналитическую модель и готовые правила расчёта. Data Lake чаще держит более сырой слой файлов, событий и полуобработанных данных для последующей работы. Эти слои могут жить рядом, но задачи у них разные. Их не стоит смешивать в один уровень.

Какая ошибка встречается чаще всего?

Часто команды не фиксируют гранулярность факта и правила метрики. Тогда одна и та же цифра начинает считаться по-разному в двух отчётах, и доверие к аналитике быстро падает. Эту проблему потом сложно лечить одними SQL-правками. И спор быстро уходит на уровень бизнеса.