Live-данные · обновлено 23 июня 2026

Навыки специалиста по моделям данных: что требуют работодатели

Q: Какие навыки нужны специалисту по моделям данных в первую очередь?

По данным 175 вакансий чаще всего требуются: Python (88.6%), SQL (61.7%), PyTorch (49.7%), pandas (44%), LLM (43.4%).

Q: Что должен знать Junior Data Scientist?

На уровне Junior важен базовый стек: Python, SQL, PyTorch. Рынок ориентирован на Senior (48.2% вакансий), поэтому конкуренция за начальные позиции высокая.

Q: Что должен уметь Middle Data Scientist?

На уровне Middle (33.6% вакансий) работодатели ожидают уверенного владения: Python (91.3%), SQL (60.9%), PyTorch (54.3%), LLM (45.7%), scikit-learn (43.5%). Требования расширяются относительно начального уровня.

Q: Что ждут от Senior специалиста по моделям данных?

Senior (48.2% вакансий) — доминирующий грейд. Чаще всего требуют: Python (83.3%), SQL (65.2%), PyTorch (56.1%), pandas (50%), LLM (50%), scikit-learn (45.5%). На этом уровне добавляются системное мышление, архитектурные решения и наставничество.

Q: Нужен ли специалисту по моделям данных SQL?

SQL встречается в 61.7% вакансий, PostgreSQL — в 18.3% (32 из 175). Это базовые требования большинства позиций.

Q: Нужен ли специалисту по моделям данных Git?

Git встречается в 25.7% вакансий (45 из 175). Обычно ожидается на любом грейде.

Q: Нужен ли специалисту по моделям данных Linux?

Linux — важный навык для работы с серверной инфраструктурой.

Q: Нужен ли специалисту по моделям данных Docker?

Docker встречается в 22.9% вакансий специалиста по моделям данных (40 из 175). Навык особенно важен на Middle/Senior.

Q: Нужен ли специалисту по моделям данных Kubernetes?

Kubernetes востребован на Middle/Senior, особенно в DevOps-ориентированных командах.

Q: Какие навыки повышают зарплату специалиста по моделям данных?

Зарплатная премия рассчитывается при достаточной выборке. Подробнее — на странице зарплат.

На основе 175 вакансий — частотность навыков, разбивка по грейдам, связки технологий.

ИА Игорь Антонов · Технический редактор · Senior Data Scientist

Навыков в анализе

топ-20 по частоте

Самый частый навык

88.6%

Python

Навыков / вакансия

медиана

Преобладает грейд

Senior

48.2% вакансий

Python 88.6% SQL 61.7% PyTorch 49.7% pandas 44% LLM 43.4% Все навыки →

Топ-навыки По грейдам По категориям Связки Что учить первым Зарплатная премия Курсы Вопросы и ответы

Ищете зарплатную статистику? Сколько зарабатывает Data Scientist? →

Какие навыки чаще всего требуют от специалиста по моделям данных

Частота упоминания в 175 активных вакансиях. Клик по заголовку колонки — сортировка.

#	Навык ↕	↓ Доля	↕ Вакансий
1	Python	88.6%	155
2	SQL	61.7%	108
3	PyTorch	49.7%	87
4	pandas	44%	77
5	LLM	43.4%	76
6	scikit-learn	41.7%	73
7	NumPy	40%	70
8	Apache Spark	34.3%	60
9	RAG	28.6%	50
10	CatBoost	25.7%	45
11	Git	25.7%	45
12	Apache Airflow	24.6%	43
13	Apache Hadoop	24.6%	43
14	Docker	22.9%	40
15	LangChain	22.9%	40
16	LightGBM	19.4%	34
17	XGBoost	19.4%	34
18	PostgreSQL	18.3%	32
19	TensorFlow	16.6%	29
20	MLflow	16%	28

Доля = процент вакансий специалиста по моделям данных, в которых упоминается навык. Одна вакансия может содержать несколько навыков. На основе 175 вакансий, 23 июня 2026.

Базовые (≥60%)

Нужны практически всегда

Python SQL

Дифференцирующие (20–60%)

Влияют на специализацию

PyTorch 49.7% pandas 44% LLM 43.4% scikit-learn 41.7% NumPy 40% Apache Spark 34.3% RAG 28.6% CatBoost 25.7% Git 25.7% Apache Airflow 24.6% Apache Hadoop 24.6% Docker 22.9% LangChain 22.9%

Нишевые (<20%)

Для специализированных ролей

LightGBM 19.4% XGBoost 19.4% PostgreSQL 18.3% TensorFlow 16.6% MLflow 16%

Навыки по грейдам: Junior, Middle, Senior

Доля вакансий каждого грейда, в которых встречается навык. Фильтр — кнопки ниже. Ячейки с «≈» — оценка по выборке менее 20 вакансий.

Распределение по рынку: Senior — 48.2%, Middle — 33.6%, Junior — 9.5%.

Навык	Intern	Junior	Middle	Senior	Lead
Python	≈100%	≈100%	91.3%	83.3%	≈66.7%
SQL	≈66.7%	≈61.5%	60.9%	65.2%	≈22.2%
PyTorch	≈33.3%	≈61.5%	54.3%	56.1%	≈22.2%
pandas	≈66.7%	≈46.2%	≈39.1%	50%	≈44.4%
LLM	≈33.3%	≈38.5%	45.7%	50%	≈44.4%
scikit-learn	≈33.3%	≈38.5%	43.5%	45.5%	≈44.4%
NumPy	≈33.3%	≈46.2%	≈34.8%	43.9%	≈44.4%
Apache Spark	≈33.3%	≈23.1%	≈28.3%	43.9%	≈22.2%
RAG	—	≈30.8%	≈34.8%	31.8%	≈22.2%
CatBoost	≈33.3%	≈15.4%	≈39.1%	≈24.2%	≈22.2%
Git	≈66.7%	≈38.5%	≈32.6%	≈21.2%	—
Apache Airflow	≈33.3%	≈38.5%	≈28.3%	≈21.2%	—
Apache Hadoop	≈33.3%	≈15.4%	≈23.9%	≈25.8%	≈22.2%
Docker	≈33.3%	≈30.8%	≈23.9%	≈21.2%	—
LangChain	≈33.3%	≈23.1%	≈23.9%	30.3%	≈22.2%
LightGBM	≈33.3%	≈23.1%	≈28.3%	≈16.7%	≈22.2%
XGBoost	≈33.3%	≈15.4%	≈21.7%	≈21.2%	≈22.2%
PostgreSQL	≈33.3%	≈15.4%	≈17.4%	≈19.7%	≈11.1%
TensorFlow	—	≈7.7%	≈19.6%	≈18.2%	—
MLflow	—	≈38.5%	≈19.6%	≈13.6%	—

Значение = % вакансий данного уровня, требующих навык. «≈» — оценка (выборка <20 вакансий). «—» — нет данных. Уровень определяется по требованиям вакансии.

Стек по категориям

Навыки сгруппированы по типу технологий. Цифры — частота в вакансиях.

Ключевые навыки

Python 88.6% SQL 61.7%

Инструменты разработки

Git 25.7%

Платформы, базы и инфраструктура

Docker 22.9% PostgreSQL 18.3%

Сопутствующий рабочий контекст

PyTorch 49.7% pandas 44% LLM 43.4% scikit-learn 41.7% NumPy 40% Apache Spark 34.3% RAG 28.6% CatBoost 25.7%

Какие навыки идут в связке

Пары навыков, которые чаще всего встречаются в одной вакансии. Доля — % вакансий специалиста по моделям данных с обоими навыками.

Навык A	+	Навык B	Вакансий	Доля
Python	+	SQL	104	59.4%
Python	+	PyTorch	76	43.4%
Python	+	pandas	73	41.7%
Python	+	scikit-learn	72	41.1%
Python	+	NumPy	68	38.9%
pandas	+	NumPy	66	37.7%
Python	+	LLM	64	36.6%
pandas	+	scikit-learn	63	36%
scikit-learn	+	NumPy	59	33.7%
Python	+	Apache Spark	57	32.6%
SQL	+	pandas	55	31.4%
SQL	+	scikit-learn	54	30.9%
SQL	+	NumPy	53	30.3%
PyTorch	+	LLM	53	30.3%
LLM	+	RAG	48	27.4%

На основе 175 вакансий, 23 июня 2026. Показаны пары с ≥10 совместными упоминаниями.

Как мы считаем навыки

Источник данных: 175 вакансий в московском сегменте. Навыки извлечены автоматически из текста каждой вакансии. Все значения рассчитываются на основе реальных данных — без ручной редакции.

Доля (share %): доля вакансий профессии, в которых упомянут навык. Одна вакансия может упоминать несколько навыков — суммарная доля может превышать 100%.

Данные по грейдам: грейд определяется по требованиям каждой вакансии (уровень опыта). Ячейки с «≈» — оценка: выборка менее 20 вакансий. Ячейки «—» — данных нет.

Связки навыков: пары, встречающиеся вместе в ≥10 вакансиях (порог надёжности данных).

Зарплатная премия: разница медианы вакансий с навыком к медиане профессии. Показывается при наличии ≥20 вакансий с зарплатой. «Оценка» — 20–29 вакансий.

Обновлено: 23 июня 2026 · 175 вакансий

Что учить специалисту по моделям данных первым

Порядок опирается на частотность навыков по данным вакансий и логику освоения специализации. Список — ориентир, не жёсткое правило.

1

Python и базовые библиотеки (88.6%)

NumPy, Pandas — обработка данных; Jupyter/VS Code, виртуальные окружения.
2

Классический ML (41.7%)

Scikit-learn: линейные модели, деревья, градиентный бустинг, оценка качества моделей.
3

Нейросетевые фреймворки (49.7%)

PyTorch или TensorFlow/Keras — архитектуры, обучение, инференс.
4

LLM и языковые модели (43.4%)

Трансформеры, API OpenAI/YandexGPT/GigaChat, prompt engineering, few-shot learning.
5

RAG и векторные базы данных (28.6%)

Retrieval-Augmented Generation: эмбеддинги, Qdrant/Chroma/Weaviate, similarity search.
6

Агентные фреймворки и оркестрация (22.9%)

LangChain, LlamaIndex — AI-пайплайны, tool calling, многоагентные системы.
7

Деплой и сервинг моделей (22.9%)

FastAPI/gRPC для инференса, Docker, ONNX — оптимизация latency в production.
8

MLOps и мониторинг (16%)

MLflow, DVC, Airflow — версионирование экспериментов, воспроизводимость, мониторинг дрейфа.

Курсы · подобрано по данным рынка

Курсы для специалиста по моделям данных

Сопоставили программы с реальным стеком из 175 вакансий — оценка соответствия рассчитана автоматически, это не реклама.

Все курсы →

Соответствие = доля ключевых навыков вакансий, которые закрывает программа курса. На основе 175 вакансий, обновлено автоматически.

Вопросы и ответы

Какие навыки нужны специалисту по моделям данных в первую очередь?

По данным 175 вакансий чаще всего требуются: Python (88.6%), SQL (61.7%), PyTorch (49.7%), pandas (44%), LLM (43.4%).

Что должен знать Junior Data Scientist?

На уровне Junior важен базовый стек: Python, SQL, PyTorch. Рынок ориентирован на Senior (48.2% вакансий), поэтому конкуренция за начальные позиции высокая.

Что должен уметь Middle Data Scientist?

На уровне Middle (33.6% вакансий) работодатели ожидают уверенного владения: Python (91.3%), SQL (60.9%), PyTorch (54.3%), LLM (45.7%), scikit-learn (43.5%). Требования расширяются относительно начального уровня.

Что ждут от Senior специалиста по моделям данных?

Senior (48.2% вакансий) — доминирующий грейд. Чаще всего требуют: Python (83.3%), SQL (65.2%), PyTorch (56.1%), pandas (50%), LLM (50%), scikit-learn (45.5%). На этом уровне добавляются системное мышление, архитектурные решения и наставничество.

Нужен ли специалисту по моделям данных SQL?

SQL встречается в 61.7% вакансий, PostgreSQL — в 18.3% (32 из 175). Это базовые требования большинства позиций.

Нужен ли специалисту по моделям данных Git?

Git встречается в 25.7% вакансий (45 из 175). Обычно ожидается на любом грейде.

Нужен ли специалисту по моделям данных Linux?

Linux — важный навык для работы с серверной инфраструктурой.

Нужен ли специалисту по моделям данных Docker?