Мурадов Юрий
Автор статьи
Мурадов Юрий Аналитик SkillStat
Опубликовано 01.04.26 09:00
Обновлено 21.05.26 12:49

Data Scientist

Специалист по моделям ищет проверяемый сигнал в шуме. Он формулирует вопрос, готовит выборку, строит модель и объясняет, где результату можно доверять.

Коротко о профессии

Специалист по моделям работает с задачами, где нужно не просто описать прошлое, а получить проверяемый вывод для решения. Он формулирует вопрос, готовит выборку, строит модель, сравнивает её с простым правилом и объясняет, где результату можно доверять.

Главная ценность профессии — исследовательская дисциплина. Модель может выглядеть убедительно и всё равно быть ошибочной: в признаки могла попасть информация из будущего, выборка могла сместиться, метрика могла не отражать реальную цель. Поэтому работа держится на проверке, а не на эффектности алгоритма.

Позиция находится между аналитикой и инженерным внедрением. Нужно понимать продуктовый или бизнес-вопрос, владеть модельными подходами и уметь передать результат так, чтобы его не исказили после исследования.

В прикладной работе результат редко бывает абсолютно точным. Поэтому профессия требует не обещания безошибочного прогноза, а аккуратного описания риска. Специалист должен показать, какой вывод достаточно устойчив для действия, где нужен человек в петле и какую дополнительную информацию стоит собрать перед следующим решением.

По зарплате у профессии нет достаточной собственной актуальной выборки. Поэтому на странице показана оценка с явной маркировкой источника, а не точная медиана только по текущим активным вакансиям.

Актуальные данные по профессии

Актуальный срез по вакансиям, зарплате, спросу и динамике найма для специалиста по моделям данных в Москва и МО.

Вакансии Количество активных вакансий на сегодня в регионе Москва и МО. Не включает закрытые или приостановленные.
149
активных вакансий
Москва и МО · текущий срез 21.05.26
Неделю назад
97
12.05.26 +54%
Месяц назад
183
21.04.26 -19%
Спрос 50 = средний по рынку, 100 = в 4× больше вакансий чем у средней IT-профессии. Метрика считается по актуальной выборке Москва и МО.
57
из 100
Ранг по спросу
#29 из 71
Статус
Средний
Топ спроса
#1
Системный аналитик
567
#2
Бизнес-аналитик
556
#3
Продакт-менеджер
491
Оценка зарплаты
Оценка
230 000
Москва и МО · Оценка по вакансиям за 60 дней
Вакансии профессии за 60 дней · n=40
Ранг в зарплатах
Диапазон рынка
— ₽ - — ₽
оценка без месячной дельты
Средний тренд Среднее число активных вакансий за последние 30 дней по сравнению с предыдущими 30 днями. Это не текущий срез, а сглаженный тренд.
↓ 29.8%
последние 30 дней vs предыдущие 30
рынок охлаждается по сравнению с предыдущим периодом
скользящее окно 30 дней

Кто такой Data Scientist

Специалист по Data Science строит модели для прогнозов и решений: оценивает вероятность события, ищет закономерности в массивах наблюдений и помогает продукту или бизнесу принимать решения на основе модели, а не только правил. Его задача — не просто обучить алгоритм, а понять, какую проблему он действительно решает.

В работе важны постановка задачи, выбор признаков, проверка гипотез, валидация, интерпретация результата и честная оценка того, где модель помогает, а где создаёт ложную уверенность. Поэтому сильный специалист по Data Science отвечает не только за качество модели на тесте, но и за то, насколько её можно использовать в реальном решении.

От аналитика эта профессия отличается большей долей моделирования и прогноза, а от ML-инженера — тем, что здесь основной фокус на самой модели и её математической состоятельности, а не на доведении до продуктовой эксплуатации.

Ценность роли особенно заметна там, где компания уже накопила большой массив наблюдений, но без модели не может точно оценить риск, спрос, вероятность отклика, аномалию или другой сложный сигнал. Такая роль нужна, чтобы превратить этот потенциал в проверяемый инструмент.

Рабочий объект

Проверяемый вывод из данных

Главная ценность

Отделить реальный сигнал от шума и случайной связи

База

Python, SQL, статистика, машинное обучение и интерпретация

Что делает

Переводит общий вопрос в проверяемую задачу, готовит данные, строит модели, сравнивает подходы и показывает, какой вывод можно использовать в решении.

Его работа не заканчивается графиком или метрикой. Нужно довести мысль до решения: что можно менять, где нужен эксперимент и где вывод пока слишком слаб.

Где проявляется мастерство

В выборе метрики, поиске утечек, проверке на срезах, объяснении ограничений и готовности отказаться от красивой модели, если она не выдержала проверку.

Мастерство часто видно в отказе от поспешного вывода. Если данные не поддерживают решение, честный специалист говорит об этом раньше, чем модель попадёт в продукт.

С чем путают

С отчётной аналитикой и с инженерным внедрением моделей. На практике эта профессия отвечает прежде всего за качество исследования и доверие к выводу.

Отчёт может быть частью работы, но не её смыслом. Смысл — получить проверяемый вывод и показать, как его использовать без самообмана.

Чем занимается Data Scientist

Требования

сценарии, критерии и постановка задачи

  • Строить базовые сравнения и модели, выбирать метрики качества и проверять, есть ли реальный выигрыш.
  • Передавать решение аналитикам, продукту или инженерам так, чтобы смысл исследования не потерялся после внедрения.
Система

данные, api, статусы и интеграции

  • Формулировать проверяемый вопрос к данным и отделять исследовательскую задачу от расплывчатого бизнес-запроса.
  • Готовить данные, искать пропуски, смещения, утечки и ошибки, которые могут исказить результат модели.
Команда

согласование и работа с разработкой

  • Интерпретировать результат, объяснять ограничения и показывать, где модели можно доверять, а где нужен осторожный вывод.

Как выглядит работа по задаче

Каждый этап исследования должен оставлять след: почему выбран вопрос, какие данные проверены, с чем сравнивали модель и какие ограничения у вывода. Иначе результат трудно защитить.

Шаг 01

Уточняет вопрос

Определяет, какое решение нужно поддержать и что именно должно быть предсказано, объяснено или проверено. Проверяет, какое действие должно измениться после исследования и не слишком ли общий запрос пришёл от бизнеса.

Шаг 02

Проверяет данные

Ищет пропуски, смещения, дубли, странные значения и признаки, которые могут сделать результат нечестным. Сравнивает источники, ищет нестыковки во времени и смотрит, не исчезает ли часть наблюдений из анализа.

Шаг 03

Строит сравнение

Сначала задаёт простую базу, затем проверяет, даёт ли модель реальное улучшение. Показывает, насколько модель лучше простого правила, потому что сложность без выигрыша не даёт ценности.

Шаг 04

Оценивает устойчивость

Смотрит качество на разных группах, временных участках и условиях, где модель может ошибаться. Проверяет качество не только в среднем, но и на группах, где ошибка может быть особенно дорогой.

Шаг 05

Объясняет вывод

Показывает, что можно делать с результатом, где нужны ограничения и какие риски нельзя игнорировать. Фиксирует не только рекомендацию, но и условия, при которых она перестанет быть надёжной.

Специалист по моделям данных и ML-инженер: в чём разница

Обе позиции работают с моделями, но отвечают за разные части пути. Одна доказывает качество вывода, другая помогает сделать модель рабочей частью продукта.

01
Фокус
Специалист по моделям данных

Постановка, данные, метрика, модель, проверка и интерпретация.

Сервис, запуск, обновление, наблюдение и устойчивость модели после внедрения.

02
Главный риск
Специалист по моделям данных

Модель показывает красивый, но неверный вывод.

Модель полезна в исследовании, но ломается в рабочем продукте.

03
Результат
Специалист по моделям данных

Проверенный вывод с понятными ограничениями.

Рабочая функция продукта, которая принимает данные и возвращает результат.

04
Соседи
Специалист по моделям данных

Аналитика, продукт, риск, исследование.

Бэкенд, данные, эксплуатация, продуктовая разработка.

Требования работодателей

Работодателю нужен человек, который умеет не только запускать алгоритм, но и отвечать за качество вывода. Обычно ждут Python, SQL, статистику, машинное обучение, работу с признаками, экспериментами и интерпретацией результата. Но решающее отличие — способность правильно поставить задачу и честно проверить, что исходный материал действительно поддерживает вывод.

На собеседовании часто смотрят, как кандидат рассуждает о метрике, выборке, утечке признаков, переобучении, причинности и базовой линии сравнения. Если человек сразу бросается к сложной модели, не проверив простое правило и качество выборки, это слабый сигнал. В реальной работе красивый алгоритм легко проигрывает аккуратной постановке и честной валидации.

Для опытных позиций важна коммуникация с продуктом и инженерами. Нужно объяснить, почему модель ошибается на одном сегменте, где нельзя автоматизировать решение, какие признаки опасны, как изменится качество после запуска и что делать, если исходный материал начнёт вести себя иначе.

Отдельно ценится способность писать вывод так, чтобы его понял не только другой исследователь. Хороший отчёт по модели объясняет, что проверяли, с чем сравнивали, где результат устойчив, где слаб, какие действия допустимы и какие решения пока рано автоматизировать. Без этого исследование остаётся личным знанием автора.

Самый активный работодатель в текущем срезе — Сбер. Data Science. На него приходится около 91% активных вакансий по этой роли.
Топ работодателей
Компании с активными вакансиями по профессии Data Scientist
1
Сбер. Data Science
135 вак.
4
Ozon Tech
27 вак.
2
Сбер. IT
67 вак.
5
Ozon Банк
20 вак.
3
Сбер для экспертов
46 вак.
6
Альфа-Банк. Центральный офис
18 вак.
Навыки из вакансий % вакансий, где навык явно упомянут работодателем.
Навыки и инструменты, которые работодатели чаще всего указывают в вакансиях по этой роли.
Вход через junior
6%
от рынка

Рынок ориентирован на опытных специалистов.

На одну junior-вакансию приходится примерно 8.6 senior-позиции.
Навыков на вакансию
11
в среднем

Столько требований работодатели обычно собирают в одной позиции по этой роли.

Зарплата и грейды

Для специалиста по моделям данных сейчас доступна рыночная оценка дохода, а не точная медиана только по текущим активным вакансиям. Её лучше читать вместе с подписью источника и структурой рынка по уровням.
Оценка зарплаты Оценка
230 000
Москва и МО · Оценка по вакансиям за 60 дней
Вакансии профессии за 60 дней · n=40
Диапазон
-
Опора оценки
40
наблюдений в опорном срезе
Позиция в топе
для оценки рейтинг не показывается
Даже когда на странице показана оценка, главный фактор роста дохода остаётся тем же: глубина задач, домен, самостоятельность и уровень ответственности внутри команды.
Зарплата по грейдам
Медиана зарплаты по грейду. n — выборка вакансий с указанной суммой.

Для estimated-режима грейдовые зарплаты не показываются, чтобы не создавать ложную точность.

Распределение по уровням
Senior
51% рынка
Lead
4%
Senior
51%
Middle
36%
Junior
6%
Intern
3%
По структуре вакансий видно, какой уровень для этой профессии считается базовым на рынке. Это помогает читать грейды не как абстрактную лестницу, а как реальную точку входа и роста.
Дополнительный разбор

Как читать оценку

Доход в этой профессии зависит от глубины задач и доверия к результату. Простая подготовка данных и повторение готового подхода оплачиваются ниже, чем самостоятельная постановка исследования, выбор метрики, проверка качества и способность объяснить, какое решение следует из модели.

Где начинается рост

Больше ценятся специалисты, которые работают с задачами высокой цены ошибки: риск, антифрод, рекомендации, поиск, ценообразование, прогнозирование спроса и персонализация. В таких местах нельзя ограничиться красивой точностью на общей выборке. Нужно понимать, где модель ошибается и какие последствия будет иметь автоматическое решение.

Что говорит структура рынка

На верхних уровнях зарплата растёт за влияние на практику команды. Опытный специалист помогает выбирать подходы, задаёт стандарты проверки, защищает выводы от случайных корреляций и умеет переводить исследование в язык продукта. Если он помогает уточнить вопрос, найти неверную метрику или остановить рискованную автоматизацию, его ценность заметно выше.

Бесплатные курсы

Бесплатные курсы для старта по профессии Data Scientist

Спрос на рынке

Спрос на специалиста по моделям данных лучше читать как сочетание объёма найма, ранга профессии в общей выборке и устойчивости вакансий во времени. Виджеты выше дают быстрый срез рынка, а график ниже помогает понять, насколько этот спрос поддерживается от месяца к месяцу.

Активные вакансии
149
в активном найме
Москва и МО · текущий срез 21.05.26
7 дней назад
97
12.05.26 +54%
Точка месяц назад
183
21.04.26 -19%
Спрос
57
из 100
Ранг по спросу
#29 из 71
Статус
Средний
Среднее по месяцам
май 122 неполный -70
апрель 192 неполный -2
март 194 неполный -97
февраль 291 неполный
Среднее число активных вакансий по месяцам
Блок показывает среднее число активных вакансий за месяц, чтобы видеть общую картину без шума отдельных дней.
май 122 неполный -70
апрель 192 неполный -2
март 194 неполный -97
февраль 291 неполный
Май пока показан как текущий неполный месяц, поэтому его лучше читать как живую картину рынка, а не как итог месяца.
Дополнительный разбор

Спрос на специалистов по моделям стал более разборчивым. Компании уже меньше покупают сам факт “у нас есть модели” и чаще спрашивают, какая задача решена, как проверено качество и что изменилось после вывода. Поэтому слабые вакансии смешивают аналитику, отчётность и случайные модели, а зрелые команды ищут людей, способных работать с неопределённостью.

ИИ-инструменты ускорили часть черновой работы: можно быстрее получить код, проверить идею, собрать базовый анализ. Но это не отменяет главного вопроса: верен ли исходный материал, корректна ли метрика, нет ли утечки, можно ли переносить результат на будущие случаи и что произойдёт при ошибке. Автоматизация помогает тому, кто уже умеет проверять, а не заменяет исследовательскую дисциплину.

На рынке сильнее выглядят кандидаты с кейсами, где есть полный путь: вопрос, выборка, базовое сравнение, модель, проверка, ограничения и вывод. Просто перечислить библиотеки мало. Нужно показать, как вы поняли, что результату можно доверять, и где вы сами остановили неверное решение.

Сохраняется спрос на специалистов, которые умеют работать с грязными и неполными выборками. В реальном продукте редко бывает идеальная таблица: события пишутся с ошибками, часть пользователей выпадает из наблюдения, исторические правила менялись, а будущий сценарий отличается от прошлого. Умение видеть эти ограничения становится конкурентным преимуществом.

Формат работы

Этот срез показывает, в каком формате работодатели чаще всего открывают вакансии по профессии: удалённо, гибридно или с полной привязкой к офису.

Сейчас сильнее всего выражен офисный формат: его отрыв от следующего сценария составляет около 4 п.п.
Удалённо
10%
Гибрид
43%
Офис
47%
По 149 вакансиям

Карьерный путь

01
Junior
Медиана

Начальный уровень помогает готовить данные, строить базовые сравнения, проверять простые модели и оформлять выводы под контролем команды. Главная задача — научиться задавать точный вопрос и не доверять результату без проверки.

02
Middle
Медиана

Средний уровень самостоятельно ведёт исследование: уточняет постановку, выбирает метрику, строит модель, проверяет устойчивость и объясняет результат продукту или аналитикам.

03
Senior
Медиана

Опытный специалист отвечает за сложные модельные направления, стандарты проверки, качество вывода и решения, где ошибка модели может дорого стоить продукту или бизнесу.

04
Lead
Медиана

Ведущий трек связан с исследовательской повесткой, развитием команды и связью моделей с реальными решениями. Здесь важно управлять не только задачами, но и доверием к модельной практике.

Где работает Data Scientist

Риск и финансы

Модели помогают оценивать вероятность события, выявлять подозрительные действия и принимать решения, где ошибка имеет прямую цену. Здесь недостаточно общей точности: нужно понимать, кто пострадает от ошибки и какие решения нельзя отдавать модели без контроля.

Продукт и рекомендации

Здесь важны ранжирование, персонализация, эксперименты и проверка того, действительно ли модель улучшает пользовательский сценарий. Модель должна улучшать реальный путь пользователя, а не только красиво выглядеть на исторических данных.

Прогнозирование и операции

В логистике, спросе, запасах и маркетинге модель помогает планировать действия, но требует осторожности к сезонности и внешним факторам. Сезонность, внешние события и изменение правил могут разрушить прошлую закономерность, поэтому прогноз всегда требует проверки контекста.

Как стать специалистом по моделям данных: с чего начать

Практический путь входа в профессию: что освоить сначала, как собрать рабочую базу и на чём быстрее всего набирается прикладная уверенность.

01
Собрать математическую базу

Освоить вероятность, статистику, проверку гипотез, метрики и ошибки измерения на простых задачах. Не пропускайте простые задачи на вероятность и статистику: они учат видеть, где вывод кажется сильнее, чем есть на самом деле.

02
Научиться работать с данными

Уверенно использовать Python и SQL, чистить данные, искать смещения и объяснять, почему выборка пригодна или непригодна. Каждый набор данных стоит описывать: источник, период, пропуски, ограничения и возможные смещения.

03
Освоить машинное обучение

Разобраться с признаками, валидацией, переобучением, базовыми моделями и интерпретацией результата. Сравнивайте модель с простым правилом и объясняйте, почему выбранная метрика связана с реальной задачей.

04
Сделать законченные исследования

Каждый проект должен показывать вопрос, данные, сравнение, модель, проверку, ограничения и вывод для решения. Добавьте раздел про то, какие действия допустимы после вывода и какие решения пока делать нельзя.

05
Искать вход рядом с данными

Подойдут аналитика, стажировки, исследовательские задачи и роли, где можно постепенно брать больше модельной ответственности. Работа аналитиком может стать хорошим стартом, если постепенно брать задачи с прогнозом, сегментацией и проверкой гипотез.

Платные курсы

Курсы по профессии Data Scientist

Релевантность профессии Как считаем индекс

Мы проанализировали программы курсов по этой профессии, выделили ключевые навыки и темы и сопоставили их с текущими требованиями работодателей. Чем выше индекс, тем ближе курс к реальным ожиданиям рынка.

Плюсы и минусы профессии

Плюсы

  • Работа даёт интеллектуальную глубину: нужно искать сигнал, проверять гипотезы и понимать причину результата.
  • Можно влиять на решения в продукте, риске, маркетинге, поиске и рекомендациях.
  • Навыки статистики, проверки и интерпретации остаются ценными даже при росте автоматизации.
  • Есть развитие в исследовательский, прикладной и руководящий трек.
  • Хорошие кейсы показывают не только код, но и зрелость мышления.

Минусы

  • Высокий порог входа по статистике, данным и исследовательской дисциплине.
  • Много времени уходит на грязные данные, слабую постановку и проверку ограничений.
  • В незрелых командах результат исследования может не доходить до решения.
  • Нельзя прятаться за сложной моделью: вывод всё равно нужно объяснить и защитить.

Кому подойдет

Подходит тем, кому интересно искать закономерность, но ещё важнее — проверять собственные выводы. Здесь нужны любопытство, терпение к неопределённости, математическая аккуратность и готовность признать, что красивая модель не дала полезного результата.

Подойдет

  • Умение переводить общий бизнес-вопрос в проверяемую гипотезу.
  • Критичность к данным, метрикам, корреляциям и красивым графикам.
  • Способность объяснять ограничения результата без защитной сложности.
  • Терпение к итерациям: значительная часть работы уходит на проверку и уточнение.
  • Коммуникация с аналитиками, продуктом, риском и инженерами вокруг решения.
  • Готовность остановить внедрение, если качество вывода не выдерживает проверки.

Не подойдет

  • Не подойдёт тем, кто ждёт быстрых однозначных ответов или любит модель больше, чем проверку
  • В этой работе часто приходится сомневаться, возвращаться к данным и объяснять, почему обещать точность нельзя

Вопросы и ответы

Какие навыки нужны в этой профессии?

Нужны Python, SQL, статистика, машинное обучение, работа с признаками, выбор метрик, проверка качества, интерпретация и умение задавать точный вопрос к данным.

Можно ли войти без математической базы?

Можно начать обучение, но без статистики, вероятности и проверки гипотез будет трудно. Именно эта база помогает отличать реальный сигнал от случайной закономерности.

Как ИИ влияет на профессию?

ИИ ускоряет черновой код и первичный анализ, но не снимает ответственность за постановку, качество данных, метрику, проверку и честную интерпретацию результата.

Сколько зарабатывает специалист по моделям данных?

Доход зависит от сложности задач и цены ошибки. Выше оплачиваются специалисты, которые умеют ставить исследование, проверять качество, объяснять ограничения и влиять на решения.

Нужно ли глубокое программирование?

Нужно уверенно писать код для данных и экспериментов. Для внедрения в продукт часто подключаются инженеры, но без аккуратного кода и понимания ограничений результат трудно передать дальше.

Чем эта работа отличается от аналитики данных?

Аналитик чаще объясняет уже произошедшее через метрики и отчёты. Специалист по моделям данных строит проверяемые модели, прогнозы и выводы для решений с неопределённостью.