| Data Scientist | Проверяемый вывод из данных | Формулирует задачу, готовит выборку, строит baseline, модель и валидацию | Решение с понятными ограничениями и метрикой | Python, SQL, статистика, ML, метрики, feature engineering, интерпретация | Это базовая роль сравнения |
| Data Analyst | Понимание метрик и прошлого поведения | Делает выборки, отчёты, исследования, визуализации и продуктовые выводы | Пояснение, что произошло и где искать причину | SQL, BI, статистика, метрики, продуктовая аналитика | Меньше моделирования и автоматического прогноза, больше объяснения данных |
| ML Engineer | Рабочий сервис вокруг модели | Запускает модель в продукт, обновляет, мониторит и делает её устойчивой | Модель как сервис с API, пайплайном и мониторингом | Python, backend, MLOps, Docker, Kubernetes, monitoring | Фокус смещён с валидации гипотезы на эксплуатацию и надёжность |
| Data Engineer | Потоки, хранилища и качество данных | Собирает источники, витрины, пайплайны и проверки качества | Надёжный маршрут данных для аналитики и моделей | SQL, Spark, Airflow, DWH, orchestration, data quality | Отвечает за данные как систему, а не за модельный вывод |
| AI Engineer | Прикладная AI-функция в продукте | Собирает LLM или RAG-сценарий, API, evals, fallback и интеграции | Рабочая функция с ИИ внутри пользовательского сценария | Python, LLM, RAG, embeddings, FastAPI, evals, product engineering | Сильнее завязан на сервис и UX AI-функции, чем на исследовательскую постановку |
| MLOps Engineer | Инфраструктура ML-цикла | Делает reproducibility, CI/CD, registry, monitoring, drift и handoff | Устойчивый ML-контур вокруг команд и моделей | Docker, Kubernetes, MLflow, CI/CD, observability, IaC | Фокус не на модели как таковой, а на надёжной среде для её жизни |
| Research Scientist | Новый метод и исследовательская новизна | Проверяет гипотезы уровня метода, пишет прототипы и иногда публикации | Новый алгоритм, эксперимент или исследовательский прототип | Математика, deep learning, papers, experimentation, PyTorch | Чаще работает с новизной метода, а не с прикладным бизнес-решением |
| NLP Engineer | Языковые модели и текстовые пайплайны | Строит классификацию текстов, поиск, embeddings, RAG и LLM-процессы | Рабочая NLP-функция или текстовый сервис | Python, PyTorch, transformers, embeddings, retrieval, evals | Уже специализируется на одном домене, а не на широком наборе DS-задач |
| Computer Vision Engineer | Модели для изображений и видео | Работает с разметкой, detection, segmentation, embeddings и качеством визуальных данных | CV-модель или сервис для изображения | PyTorch, CV, augmentation, labeling, metrics, deployment basics | Так же специализируется на одном домене, где данные и метрики другие |