Live-данные · обновлено 23.06.26

ML-инженер: кто это и чем занимается

ML-инженер доводит модели машинного обучения до рабочих продуктовых решений: от данных и обучения до внедрения и качества. SkillStat показывает медиану зарплаты, спрос и навыки.

АМ Алексей Морозов · Технический редактор · Senior Machine Learning Engineer
Вакансии
155
Москва и МО · 23.06.26
Медиана зарплаты
287 000 ₽
вилка 230 000–425 000 ₽
По вакансиям за 60 дней
Спрос
55 / 100
Средний · #22
Уровень
Senior
45% вакансий
Формат
гибридный формат
удал. 13% · гибрид 54% · офис 33%
Выборка зарплат
45
вакансий с зарплатой

Как ещё называют ML-инженера

В вакансиях ML-инженера называют по-разному. Часть названий — прямые синонимы, часть относится к соседним ролям: они пересекаются по стеку, но отвечают за другой результат.

Синонимы
ML-инженерMachine Learning EngineerML Engineerинженер машинного обученияинженер по машинному обучениюспециалист по машинному обучениюинженер ML-системML-разработчик
Смежные роли
Data ScientistMLOps EngineerAI EngineerData EngineerBackend DeveloperResearch ScientistNLP EngineerComputer Vision EngineerLLM Engineer
Рыночный вывод

Свежие данные рынка: 155 активных вакансий, медиана зарплаты 287 000 ₽, спрос 55/100. Срез по Москве и МО от 23.06.2026.

Для ML-инженера сейчас используется 60-дневный live-срез: SkillStat считает медиану по вакансиям с раскрытой зарплатной вилкой и не привязывает нишевую роль к одной шумной дневной точке. Выборка профессии за окно — n=45.

Спрос средний: текущая точка выше значений за 7 и 30 дней, но месячные средние показывают волнообразный рынок. ML-инженерия усиливается там, где компании переходят от экспериментов к рабочим AI/ML-функциям, которые нужно запускать, наблюдать, обновлять и ограничивать в реальном продукте.

Коротко о профессии

ML-инженер отвечает за путь модели в продукте. Он работает с входным материалом, обучением, проверкой, прикладным слоем, запуском, наблюдением и обновлением. Его цель — сделать так, чтобы модель не просто показала хороший результат в исследовании, а стабильно работала в реальном сценарии.

В этой профессии важно соединить два языка. Исследователю нужно сохранить смысл модели и качество вывода. Инженерам — получить понятный контракт, скорость, ошибки и поддержку. Продукту — понимать, где модель помогает, а где ей нельзя доверять без ограничений.

Главная граница проходит между экспериментом и рабочей функцией. Эксперимент может быть быстрым и хрупким. Рабочая функция должна иметь версии, проверки, журналирование, понятные отказы и план обновления.

После релиза модель живёт в меняющейся среде. Пользователи ведут себя иначе, входной материал стареет, соседние приложения меняют формат, бизнес добавляет новые правила. Поэтому ML-инженер думает не только о первом запуске, но и о том, как команда будет замечать проблемы, обновлять решение и сохранять доверие к результату.

Как читать данные на странице

Числовые метрики показывают вакансии Москвы и Московской области. Описание роли, задач и навыков относится к профессии в целом.

Регион
Москва и МО
Срез
23.06.26
Зарплата
По вакансиям за 60 дней
Выборка
n=45

Актуальные данные по профессии

Актуальный срез по вакансиям, зарплате, спросу и динамике найма для ML-инженера в Москве и МО.

Вакансии Количество активных вакансий на сегодня в регионе Москва и МО. Не включает закрытые или приостановленные.
155
активных вакансий
Москва и МО · текущий срез 23.06.26
7 дней назад
156
16.06.26 -1%
30 дней назад
136
24.05.26 +14%
Спрос 50 = средний по рынку, 100 = в 4× больше вакансий чем у средней IT-профессии. Метрика считается по актуальной выборке Москва и МО.
55
из 100
Ранг по спросу
#22 из 71
Статус
Средний
Топ спроса
#1
Системный аналитик
645
#2
Продакт-менеджер
521
#3
Бизнес-аналитик
504
Медианная зарплата
287 000
Москва и МО · По вакансиям за 60 дней
Ранг в зарплатах
#3 из 31
Диапазон рынка
230 000 ₽ - 425 000 ₽
март 2026 г. +36%
Топ зарплат
#1
Техлид
402 000 ₽
#2
Тимлид
345 000 ₽
#3
ML-инженер
287 000 ₽
Средний тренд Сначала сравниваем последние 30 дней с предыдущими 30. Если в одном из окон меньше 14 точек, пробуем 45, 60, 90 дней. Ряд использует ту же семантику активных публичных вакансий, что и верхнее число.
↑ 7.1%
последние 30 дней vs предыдущие 30
среднее последнего окна выше предыдущего
146 против 136 вакансий, последние 30 дней vs предыдущие 30
сглаживание 30 дней

Кто такой ML-инженер

ML-инженер — это инженер, который доводит модель машинного обучения до использования в продукте или внутреннем процессе. Он работает не только с обучением, но и с данными, признаками, артефактами модели, API, batch inference, версиями, мониторингом качества, обновлениями и откатом.

Главная граница роли проходит между экспериментом и рабочей функцией. Ноутбук может доказать, что подход перспективен. ML-инженер должен сделать так, чтобы этот подход можно было воспроизвести, запустить, проверить на новых данных, встроить в сервис или пайплайн и сопровождать после релиза.

Поэтому сильный ML-инженер думает сразу о нескольких вещах: где взять данные, как избежать leakage, какой baseline честный, как сохранить модель и preprocessing, как быстро отвечает inference, какие ошибки возможны, как заметить drift и что делать, если новая версия стала хуже.

Рабочий объект

Путь модели от данных до ответа в продукте

Главная ценность

Модель работает, обновляется и контролируется после запуска

База

Python, SQL, машинное обучение, API, Docker, Git и наблюдение качества

Что делает

Берёт модельный подход и превращает его в сопровождаемое решение: готовит данные, сохраняет артефакты, поднимает сервисный слой, проверяет качество и помогает команде обновлять модель.

Дополнительно отвечает за договор между моделью и продуктом: какие данные допустимы, какие ответы возможны, что считается ошибкой и когда решение нужно отключить.

Где проявляется мастерство

В случаях, где эксперимент уже работает, но продуктовая жизнь сложнее: данные приходят иначе, ответ задерживается, качество меняется, а соседние команды ждут понятный контракт.

Мастерство видно там, где модель перестаёт быть идеальной: пришли странные данные, ответ стал медленным, качество просело, а продукт всё равно должен работать безопасно.

С чем путают

С исследователем моделей и с обычным серверным разработчиком. ML-инженер работает между ними и отвечает за то, чтобы модель стала устойчивой частью продукта.

Если человек только обучает модель, он ближе к исследованию. Если только поднимает сервис, он ближе к бэкенду. ML-инженер связывает эти части в один рабочий путь.

Чем занимается ML-инженер

Требования

сценарии, критерии и постановка задачи

  • Настраивает проверки качества: offline metrics, online signals, drift, деградацию, latency, error rate и алерты.
Система

данные, api, статусы и интеграции

  • Готовит путь модели от данных и обучения до API, batch-задачи или другой формы inference в продукте.
  • Следит за воспроизводимостью: фиксирует код, данные, конфиги, признаки, метрики, артефакты и версии модели.
  • Оборачивает модель в сервисный слой: FastAPI, REST API, validation, response schema, timeout, error handling и логи.
Команда

согласование и работа с разработкой

  • Помогает безопасно выкатывать новую модель через shadow, canary, сравнение качества, rollback plan и release notes.
  • Договаривается с Data Scientist, backend, data, product и MLOps-командами о границах модели и цене ошибки.

Как выглядит работа по задаче

В реальной задаче ML-инженер постоянно проверяет, не потерялся ли смысл модели при переносе в продукт. Техническая обвязка должна сохранять качество, а не только запускать код.

Шаг 01

Разбирает сценарий

Уточняет, кто вызовет модель, какие данные придут, как быстро нужен ответ и что делать при ошибке. Уточняет не только вход и ответ, но и цену задержки, допустимый отказ и действие команды при сомнительном результате.

Шаг 02

Готовит данные и обучение

Настраивает повторяемую подготовку данных, обучение, сохранение версии и проверку результата. Фиксирует версии, параметры и признаки, чтобы результат можно было повторить и сравнить после изменений.

Шаг 03

Создаёт рабочий механизм

Оборачивает модель в сервис, задачу по расписанию или другой способ использования в продукте. Выбирает форму запуска под задачу: быстрый ответ, пакетная обработка, асинхронная очередь или ручная проверка перед действием.

Шаг 04

Следит за качеством

Настраивает сигналы деградации, ошибки, задержки и ограничения, которые важны для команды. Разделяет технические сбои и ухудшение модели, потому что лечатся они по-разному.

Шаг 05

Обновляет безопасно

Помогает выкатывать новую версию, откатываться при проблемах и документировать изменения. Планирует выпуск новой версии так, чтобы команда могла сравнить поведение и вернуться назад при проблеме.

ML-инженер, Data Scientist, MLOps, AI Engineer и Backend — в чём разница

Эти роли часто пересекаются по Python, данным и инфраструктуре, но отвечают за разные результаты. ML-инженер ближе всего к конкретной модели и её работе в продукте.

Роль
ML Engineer
Главный фокус

Довести модель до сервиса, batch pipeline или другой рабочей функции.

Что делает

Отвечает за model serving, артефакты, качество, мониторинг, обновление и откат конкретной ML-функции.

Роль
Data Scientist
Главный фокус

Поставить ML-задачу, исследовать данные, построить модель и доказать качество вывода.

Что делает

Чаще отвечает за исследование и валидацию; ML-инженер забирает модель в production-контур.

Роль
MLOps Engineer
Главный фокус

Платформа и процесс для многих моделей.

Что делает

Строит registry, CI/CD, мониторинг, оркестрацию и стандарты; ML-инженер ближе к конкретной модели и продуктовой задаче.

Роль
AI Engineer
Главный фокус

Прикладная AI-функция на базе LLM, RAG, API and product workflow.

Что делает

Чаще интегрирует готовые модели и LLM-сервисы; ML-инженер глубже отвечает за обучение, inference and model quality.

Роль
Data Engineer
Главный фокус

Данные, пайплайны, хранилища, качество и доступность источников.

Что делает

Готовит слой данных; ML-инженер использует его для признаков, обучения and inference.

Роль
Backend Developer
Главный фокус

API, сервисы, бизнес-логика, базы and reliability приложения.

Что делает

Может запускать модель как часть сервиса, но обычно не отвечает за ML-метрики, drift and training lifecycle.

Роль
Research Scientist
Главный фокус

Новые методы, архитектуры, эксперименты and публикационная или исследовательская глубина.

Что делает

Ближе к исследованию; ML-инженер отвечает за прикладной запуск и сопровождение решения.

Роль
NLP Engineer
Главный фокус

Текст, embeddings, classification, extraction, search, LLM and evaluation.

Что делает

Это специализация ML-инженера или Data Scientist по NLP-стеку.

Роль
Computer Vision Engineer
Главный фокус

Изображения, видео, detection, segmentation, OCR and visual quality.

Что делает

Это специализация ML-инженера по CV-моделям, данным и inference.

Роль
LLM Engineer
Главный фокус

LLM-приложения, RAG, evals, prompts, retrieval, cost and safety.

Что делает

Частный AI/ML production слой; ML-инженер может закрывать его, если отвечает за качество, deployment and monitoring.

ML-инженер и MLOps-инженер: в чём разница

Обе роли помогают моделям жить после эксперимента, но фокус разный. ML-инженер ближе к конкретной модели и продуктовой задаче, MLOps-инженер — к платформе и повторяемому процессу для многих моделей.

01
Фокус
ML-инженер

Конкретная модель, данные, сервисный слой и качество в продукте.

Платформа, процессы, автоматизация, наблюдение и стандарты для команды.

02
Рабочий результат
ML-инженер

Модель становится рабочей функцией продукта.

Команда получает повторяемый путь для запуска и сопровождения моделей.

03
Риск
ML-инженер

Модель не выдержит реальные данные или продуктовые ограничения.

Каждый запуск будет ручным, хрупким и плохо наблюдаемым.

04
Соседи
ML-инженер

Исследователи, продукт, бэкенд, аналитика.

Инфраструктура, данные, эксплуатация, несколько ML-команд.

Навыки ML-инженера: что требуют работодатели

Работодателю нужен инженер, который понимает ML и умеет довести его до работающего контура. В вакансиях поэтому рядом встречаются Python, SQL, PyTorch, Docker, FastAPI, Kubernetes, Airflow, MLflow, Git, CI/CD, LLM, RAG, PostgreSQL and Kafka. Это не случайный набор слов: он показывает путь модели от данных до эксплуатации.

От junior-кандидата ждут не энциклопедического знания всех инструментов, а одного законченного production-like проекта. В нём должны быть данные, baseline, обучение, артефакт модели, сервис или batch pipeline, Docker, тесты, README и хотя бы простое наблюдение за качеством.

На middle и senior уровнях важнее масштаб ответственности. Специалист должен объяснить, как воспроизвести обучение, где хранится версия модели, как безопасно выкатить обновление, как заметить деградацию и что делать, если offline-метрика хорошая, а продуктовый результат стал хуже.

В текущем активном срезе по этой роли 155 вакансий. Список работодателей ниже построен по накопленной статистике SkillStat, поэтому его нужно читать как ориентир по источникам вакансий, а не как долю текущего рынка.
Топ работодателей
Компании, которые встречаются в вакансиях по профессии ML-инженер
1
Сбер. IT
73 вак.
2
Сбер. Data Science
48 вак.
3
Сбер для экспертов
27 вак.
4
ООО ИЦ АЙ-ТЕКО
20 вак.
5
"МТС", Работа в IT
18 вак.
6
МАГНИТ, Розничная сеть. IT
17 вак.
Вход через junior
9%
от рынка

Рынок ориентирован на опытных специалистов.

На одну junior-вакансию приходится примерно 4.9 senior-позиции.
Навыков на вакансию
10
в среднем

Столько требований работодатели обычно собирают в одной позиции по этой роли.

Курс · подобран по данным рынка

Лучший курс для ML-инженера

Соответствие рассчитано по стеку из 155 вакансий — это не реклама, а совпадение со спросом работодателей.

Все курсы →
Лучшее совпадение
96%
соответствие
Практикум
Практикум
онлайн · с куратором
ML-инженер
12 месяцев Сертификат
4.5
192 000 ₽
Сравнить все курсы

ML Engineer Core: что реально нужно знать

ML-инженеру нужен не список модных инструментов, а понимание полного пути модели. Ниже — рабочие группы знаний, которые отделяют production ML от хорошего ноутбука.

ML-база

Supervised and unsupervised learning, baseline, feature engineering, train/test split, cross-validation, overfitting, leakage and metrics. Это слой, без которого невозможно честно оценить модель.

Данные

SQL, pandas, NumPy, data quality, пропуски, дубли, temporal split and feature store на базовом уровне. ML-инженер должен понимать, откуда берутся признаки и где они ломаются.

Модели

Scikit-learn, PyTorch, CatBoost, LightGBM, XGBoost, embeddings and LLM/RAG по необходимости. Важен не бренд библиотеки, а выбор подхода под задачу и ограничения.

Сервисный слой

FastAPI, REST API, batch inference, online inference, validation, error handling, timeout and response schema. Модель должна отвечать предсказуемо и понятно для соседнего продукта.

Артефакты и версии

Model artifact, preprocessing pipeline, feature schema, config, dataset version, model version and model registry. Без версий невозможно понять, какая модель дала какой результат.

Проверка качества

Offline metrics, online metrics, drift, деградация, A/B, shadow deployment, canary release and rollback. После релиза качество не становится постоянным.

Production

Docker, CI/CD, Kubernetes basics, logs, monitoring, health checks, secrets and configs. Этот слой делает модель сопровождаемой, а не ручным запуском на машине автора.

MLOps

MLflow, Airflow, pipelines, experiment tracking, reproducibility, retraining and scheduled jobs. ML-инженер не всегда строит платформу, но обязан понимать процесс.

LLM/RAG production

Retrieval, embeddings, evals, hallucination checks, cost/latency, fallback and human-in-the-loop. LLM-функция без оценки качества быстро превращается в риск.

Коммуникация

Границы модели, ограничения, цена ошибки, когда модель нельзя использовать, handoff с Data Scientist, backend, product and MLOps. Production ML всегда межкомандная работа.

Сколько зарабатывает ML-инженер

По SkillStat для Москвы и МО медиана зарплаты ML-инженера сейчас считается по вакансиям профессии за 60 дней, n=45. Это live-срез с раскрытыми зарплатными вилками; 60-дневное окно сглаживает шум одной дневной точки.
Сама медиана показывает центр рынка, но не объясняет, за счёт чего специалист растёт в доходе. Для этого важнее посмотреть, как меняется зарплата по уровням и где начинается заметный разрыв между грейдами.
Зарплата по грейдам
Медиана зарплаты по грейду. n — выборка вакансий с указанной суммой.

Грейдовые медианы не показываются, если в каждом уровне не хватает publishable-выборки. Распределение по уровням рядом показывает структуру вакансий, а не зарплатные вилки.

Распределение по уровням
Senior
45% рынка
Lead
12%
Senior
45%
Middle
33%
Junior
9%
Intern
1%
По структуре вакансий видно, какой уровень для этой профессии считается базовым на рынке. Это помогает читать грейды не как абстрактную лестницу, а как реальную точку входа и роста.
Дополнительный разбор

Как читать медиану

На доход влияет не само знание PyTorch, MLflow или Docker, а ответственность за production lifecycle модели. Дороже оплачиваются задачи, где модель влияет на деньги, риск, пользовательский опыт или операционные решения, а ошибка может долго оставаться незаметной.

Где начинается рост

Сильнее ценятся специалисты, которые умеют соединить качество модели и инженерную надёжность: reproducible training, model registry, FastAPI serving, batch inference, monitoring, drift, rollback, cost/latency and incident response. Чем меньше ручного хаоса нужно для следующего релиза модели, тем выше уровень ML-инженера.

Вакансии ML-инженера: спрос и динамика рынка

Спрос на ML-инженера лучше читать как сочетание объёма найма, ранга профессии в общей выборке и устойчивости вакансий во времени. Виджеты выше дают быстрый срез рынка, а график ниже помогает понять, насколько этот спрос поддерживается от месяца к месяцу.

Активные вакансии
155
в активном найме
Москва и МО · текущий срез 23.06.26
7 дней назад
156
16.06.26 -1%
30 дней назад
136
24.05.26 +14%
Спрос
55
из 100
Ранг по спросу
#22 из 71
Статус
Средний
Среднее число активных вакансий по месяцам
Блок показывает среднее число активных вакансий за месяц, чтобы видеть общую картину без шума отдельных дней.
июнь 149 неполный +15
май 134 -42
апрель 176 +50
март 126 -53
февраль 179
Июнь пока показан как текущий неполный месяц, поэтому его лучше читать как живую картину рынка, а не как итог месяца.
Дополнительный разбор

На 23.06.2026 SkillStat видит 155 активных вакансий ML-инженера в Москве и МО. 7 дней назад было 156, 30 дней назад — 136. спрос — 55/100, ранг — #22 из 71, статус — средний.

Спрос средний: текущая точка выше значений за 7 и 30 дней, но месячные средние показывают волнообразный рынок. ML-инженерия усиливается там, где компании уже не довольствуются экспериментом и хотят рабочую AI/ML-функцию с запуском, наблюдением, обновлением и ограничениями.

Вакансии стоит читать аккуратно. В незрелых командах ML Engineer может выглядеть как Data Scientist с Docker или backend-разработчик с моделью. В зрелой команде роль видна по полному контуру: данные, обучение, registry, API или batch, мониторинг, drift, rollback and ownership after release.

Формат работы ML-инженера

Этот срез показывает, в каком формате работодатели чаще всего открывают вакансии по профессии: удалённо, гибридно или с полной привязкой к офису.

Сейчас сильнее всего выражен гибридный формат: его отрыв от следующего сценария составляет около 21 п.п.
Удалённо
13%
Гибрид
54%
Офис
33%
По 155 вакансиям

Карьерный путь ML-инженера

Грейдовые медианы показываются только для уровней с достаточной зарплатной выборкой. Если данных хватает не по всем уровням, SkillStat не выводит отдельную salary-колонку в карьерных карточках, чтобы не повторять пустые значения.

01
Junior

Начальный уровень помогает с подготовкой данных, простыми моделями, скриптами, проверками и небольшими сервисными задачами. Главная цель — понять, почему модель может работать в исследовании и сбоить после запуска.

02
Middle

Средний уровень самостоятельно ведёт прикладную задачу: данные, обучение, проверка, сервисный слой, релиз и базовое наблюдение за качеством.

03
Senior

Опытный ML-инженер проектирует путь модели в продукте, отвечает за деградацию, обновления, договоры с соседними сервисами и техническую цену сопровождения.

04
Lead

Ведущий трек связан с практикой ML-направления: стандарты качества, повторяемые запуски, развитие команды и выбор границ между исследованием, продуктом и инфраструктурой.

Где работает ML-инженер

Рекомендации и поиск

Здесь модель влияет на порядок выдачи, персонализацию и пользовательский выбор, поэтому важны скорость, качество и проверка эффекта. Помимо качества выдачи важны задержка ответа, устойчивость признаков и проверка того, что изменение не ухудшило ключевой путь.

Риск и антифрод

Модель помогает принимать решения с высокой ценой ошибки. Нужны контроль качества, объяснимость и аккуратное обновление. Даже полезная модель должна иметь ограничения, журнал решений и способ ручной проверки в спорных случаях.

Функции с ИИ в продукте

Обработка текста, изображений и сценарии с LLM требуют ограничений, проверки ответов, управления стоимостью и безопасного поведения при сбоях. В сценариях с LLM инженер следит за контекстом, безопасностью данных, стоимостью вызовов и предсказуемостью ответа.

Путь в профессию: ML-инженером

Практический путь входа в профессию: что освоить сначала, как собрать рабочую базу и на чём быстрее всего набирается прикладная уверенность.

01
Собрать ML-базу

Python, SQL, pandas, NumPy, статистика, baseline, train/test split, cross-validation, leakage and metrics.

02
Освоить прикладной modeling stack

Scikit-learn для классического ML и PyTorch на прикладном уровне для deep learning, embeddings, NLP, CV or LLM-related задач.

03
Сделать model serving

FastAPI, request/response schema, validation, timeout, error handling, Docker, tests and logs.

04
Добавить воспроизводимость

Git, config, dataset version, experiment tracking, MLflow, model artifact, model registry and comparison report.

05
Показать сопровождение

Monitoring, drift signals, latency, error rate, quality checks, rollout, rollback and README.

Путь в профессию
Как стать ML-инженером: данные из вакансий
Roadmap, junior-рынок, проекты для портфолио, первый оффер — без обещаний, с цифрами.
Как стать ML-инженером
Курсы · подобрано по данным рынка

Курсы для ML-инженера

Сопоставили программы с реальным стеком из 155 вакансий — оценка соответствия рассчитана автоматически, это не реклама.

Соответствие — доля ключевых навыков из вакансий, которые охватывает программа курса

Что не надо учить сразу

Самая частая ошибка — начать с громких инструментов и пропустить проверку модели. Для ML-инженера это опасно: production только усиливает ошибки, которые были в данных и метрике.

Не начинайте с deep learning без baseline

Сначала нужно понять данные, метрику и простую модель. Нейросеть без честного baseline не доказывает качество.

Не делайте портфолио только из ноутбука

Ноутбук показывает исследование, но не доказывает, что модель можно запустить, обновить, проверить и откатить.

Не называйте себя ML Engineer без запуска модели

Если модель нигде не работает вне эксперимента, это пока Data Science-проект, а не ML engineering.

Не учите Kubernetes раньше Docker и API

Сначала сервис, конфигурация, логи, ошибки и тесты. Kubernetes нужен позже, когда понятен сам runtime модели.

Не используйте LLM/RAG без evals

Retrieval, hallucination, cost and fallback нужно проверять. Один удачный demo-запрос не равен качеству продукта.

Не верьте метрике без проверки leakage

Feature leakage, неверный split и срезы могут дать сильную offline-метрику и провал после релиза.

Не выкатывайте модель без rollback

Новая версия может быть хуже старой. Нужен план возврата, критерии остановки и понятные release notes.

Не путайте роли только по инструментам

Data Scientist, ML Engineer and MLOps могут использовать Python, MLflow и Docker, но отвечают за разные результаты.

Что добавить в портфолио ML-инженера

Портфолио ML-инженера должно доказывать не только качество модели, но и способность запустить её в рабочем контуре. В README важны данные, baseline, запуск, ошибки, мониторинг и откат.

01

ML API-сервис

Модель, FastAPI, request/response schema, validation, Docker, tests, logs and README. Покажите, как сервис принимает вход, отвечает, обрабатывает ошибку и запускается локально.

02

Batch inference pipeline

Данные, preprocessing, model artifact, scheduled job, output table, error handling and logs. Такой проект показывает, что вы понимаете не только online API.

03

Reproducible training

Config, dataset version, experiment tracking, MLflow, metrics, model registry and comparison report. Работодатель должен увидеть, как повторить обучение и выбрать версию.

04

Model monitoring

Input distribution, prediction distribution, drift signal, latency, error rate, dashboard and alert. Важно показать, что происходит после релиза.

05

Safe rollout

Old/new model, shadow или canary, quality comparison, rollback plan and release notes. Это доказывает понимание риска обновления модели.

06

LLM/RAG production-like project

Retrieval, embeddings, evals, hallucination checks, cost/latency, fallback and human review. В README объясните, где модель может ошибиться и как ограничен риск.

Что спрашивают на собеседовании ML-инженера

На интервью проверяют не только ML-термины. Работодатель хочет понять, умеете ли вы довести модель до эксплуатации и что сделаете, когда качество или сервис начнут ломаться.

01

ML basics

Baseline, features, train/test split, cross-validation, overfitting, leakage and metrics. Частые вопросы: что такое feature leakage, как выбрать метрику и как проверить переобучение.

02

Python / SQL

pandas, NumPy, joins, aggregations and data quality checks. Спрашивают, как собрать выборку, найти пропуски, дубли и странные срезы.

03

Modeling

Scikit-learn, PyTorch, model selection, hyperparameters and calibration. Важно объяснить, почему выбранная модель подходит, а не просто назвать библиотеку.

04

Model serving

FastAPI, REST API, batch/online inference, validation, timeout and error handling. Примеры вопросов: как устроить batch inference и что делать, если inference слишком долгий.

05

MLOps

MLflow, Airflow, pipelines, experiment tracking, model registry and reproducibility. Спрашивают, где хранить версию модели и как воспроизвести обучение.

06

Monitoring

Drift, деградация, latency, error rate, online metrics and alerting. Нужно объяснить, как понять, что качество модели изменилось.

07

Deployment

Docker, CI/CD, Kubernetes basics, configs, secrets and rollback. Вопросы часто касаются safe rollout, canary release and shadow deployment.

08

LLM/RAG

Retrieval, embeddings, evals, hallucinations, cost and fallback. Спрашивают, как проверить RAG-ответы и когда нужен human review.

09

Product case

Когда модель не нужна, как оценить пользу, как ограничить риск и что делать, если offline-качество хорошее, а продуктовый результат хуже.

10

Практический сбой

Качество просело после релиза, новые данные другого формата, API отвечает слишком долго, модель даёт уверенный неправильный ответ или rollback не подготовлен.

Плюсы и минусы профессии

Плюсы

  • Работа находится рядом с реальным внедрением функций с ИИ, а не только с экспериментами.
  • Навыки соединяют машинное обучение, данные, серверную разработку и инженерную эксплуатацию.
  • Хорошие проекты показывают измеримый результат: модель работает, обновляется и выдерживает ограничения продукта.
  • Есть рост в архитектуру ML-практики, платформенные решения и техническое руководство.
  • ИИ ускоряет часть рутины, но повышает ценность инженеров, которые умеют проверять и сопровождать результат.

Минусы

  • Порог входа высокий: нужно понимать и модели, и обычную инженерную разработку.
  • Много проблем появляется после успешного эксперимента: данные меняются, качество падает, ответ задерживается.
  • Без зрелой команды можно застрять в ручном переносе моделей и постоянном тушении пожаров.
  • Ответственность трудно спрятать: если модель тихо деградирует, ущерб может копиться долго.

Кому подойдет

Подходит тем, кому интересно доводить модель до реальной работы, а не останавливаться на красивом эксперименте. Здесь помогают инженерная аккуратность, интерес к данным, терпение к итерациям и спокойное отношение к проблемам, которые появляются только после запуска.

Подойдет

  • Умение переводить исследовательскую идею в проверяемый и сопровождаемый механизм.
  • Коммуникация с исследователями, бэкендом, аналитиками, продуктом и эксплуатацией.
  • Готовность обсуждать компромисс между качеством модели, скоростью, стоимостью и сложностью поддержки.
  • Навык разбирать деградацию без поиска виноватых: данные, код, продукт или внешние условия.
  • Способность объяснять ограничения модели простым языком для команды и бизнеса.
  • Дисциплина в версиях, проверках, документации и повторяемых релизах.

Не подойдет

  • Не подойдёт тем, кто хочет заниматься только исследованием или только инфраструктурой.
  • В этой профессии нужно принимать оба мира: качество модели и цену её жизни в продукте.

FAQ по профессии ML-инженер

Кто такой ML-инженер простыми словами?

Это инженер, который делает так, чтобы модель машинного обучения не оставалась экспериментом, а работала в продукте: принимала данные, возвращала ответ, обновлялась и контролировалась после релиза.

Чем занимается Machine Learning Engineer?

Он готовит данные и признаки, обучает или дорабатывает модель, сохраняет артефакты, поднимает inference, настраивает проверки качества, мониторинг, обновление и rollback.

Какие навыки нужны ML-инженеру?

Python, SQL, pandas, NumPy, Scikit-learn, PyTorch, FastAPI, Docker, Git, тесты, MLflow, Airflow, monitoring, basics of Kubernetes and understanding of model quality.

Можно ли войти через аналитику данных?

Можно, если добрать инженерный слой: API, Docker, тесты, MLflow, Airflow, monitoring, model serving and production-like portfolio.

Заменит ли AI ML-инженеров?

AI ускорит код, черновые пайплайны и эксперименты, но не заменит ответственность за данные, качество, deployment, monitoring, drift, rollback, cost and product risk.

Чем ML-инженер отличается от AI Engineer?

AI Engineer чаще собирает прикладные AI-функции с LLM, RAG, API and product workflow. ML-инженер глубже отвечает за обучение, inference, метрики, drift and model lifecycle.

Что такое Airflow в ML?

Airflow используют для оркестрации задач: подготовка данных, обучение, batch inference, проверки, отчёты и регулярное обновление пайплайнов.

Что такое reproducible training?

Это обучение, которое можно повторить: известны код, данные, конфиги, признаки, зависимости, параметры и версия модели.

Сколько зарабатывает ML-инженер?

По SkillStat для Москвы и МО на 23.06.26 медиана зарплаты ML-инженера — 287 000 ₽. Это live-срез по вакансиям за 60 дней, выборка — n=45.

Нужно ли знать математику?

Нужна прикладная база: вероятность, статистика, метрики, ошибки, переобучение, регуляризация и интерпретация результата. Глубина зависит от типа задач.

Нужно ли знать LLM и RAG?

Да, если работа связана с production AI. Важно понимать retrieval, embeddings, evals, hallucination checks, cost, latency, fallback and access control.

Нужно ли знать Python и SQL?

Да. Python нужен для ML, сервисного слоя и пайплайнов, SQL — для выборок, проверки данных, признаков и связи модели с реальными источниками.

Почему junior-вход сложный?

В ML-инженерии мало задач без риска: на одну junior-вакансию приходится примерно 4.9 senior-позиции. Работодателю нужно видеть не только модель, но и аккуратный контур запуска.

Чем ML-инженер отличается от backend-разработчика?

Backend-разработчик отвечает за сервис и бизнес-логику. ML-инженер дополнительно отвечает за качество модели, признаки, версии, drift, inference and model rollout.

Чем ML-инженер отличается от Data Scientist?

Data Scientist чаще доказывает качество модели и вывода, а ML-инженер отвечает за то, чтобы модель стала рабочей, наблюдаемой и сопровождаемой функцией продукта.

Чем ML-инженер отличается от MLOps?

ML-инженер ближе к конкретной модели и продуктовой задаче. MLOps-инженер чаще строит платформу, стандарты и автоматизацию для многих моделей и команд.

Что добавить в портфолио ML-инженера?

ML API-сервис, batch inference pipeline, reproducible training with MLflow, model monitoring, safe rollout and LLM/RAG project with evals and README.

Что такое batch inference и online inference?

Batch inference считает предсказания пачкой по расписанию или выгрузке. Online inference отвечает на запрос почти сразу, поэтому важны latency, timeout and reliability.

Что такое canary release и shadow deployment модели?

Canary release отдаёт новую модель небольшой доле трафика. Shadow deployment запускает новую модель параллельно без влияния на пользователя, чтобы сравнить поведение.

Что такое feature leakage?

Это утечка информации из будущего или целевой переменной в признаки. Такая модель выглядит сильной offline, но ломается в реальном использовании.

Что такое MLflow?

MLflow помогает вести experiment tracking, хранить параметры, метрики, артефакты и версии моделей. В работе ML-инженера он полезен для воспроизводимости и model registry.

Что такое model drift?

Это изменение данных или связи между признаками и целевой переменной, из-за которого модель со временем теряет качество.

Что такое model registry?

Это хранилище версий моделей и связанных артефактов, где команда понимает, какая версия обучена, проверена, одобрена и запущена.

Что такое model serving?

Это запуск модели как части рабочего контура: API, batch job, очередь или другой механизм, который принимает вход, возвращает предсказание и обрабатывает ошибки.