Автор статьи

Мурадов Юрий / Analyst SkillStat

Опубликовано 6 апреля 2026 г.

Обновлено 3 июня 2026 г.

Prometheus: что это, как работает и чем отличается от Grafana

Prometheus ставят там, где сервисы надо мерить по метрикам, а не ждать жалоб. Он собирает числовые сигналы, считает запросы и запускает оповещения до того, как проблема станет видна пользователю.

Коротко о навыке

Prometheus — система мониторинга и оповещения по числовым метрикам. Она регулярно опрашивает сервисы и инфраструктуру. Данные хранятся как временные ряды, а команда работает с ними через PromQL и правила. Его часто путают с Grafana, но роли у них разные. Prometheus собирает и считает данные, а Grafana показывает их на панелях. Поэтому навык нужно понимать как полный маршрут метрики: экспортер, опрос, временной ряд, PromQL, alert rule и Alertmanager. Именно на этом маршруте виден реальный уровень. Важно не просто поднять сервер. Нужно выбрать полезные метрики, не раздуть число рядов и превратить сигнал в оповещение, после которого дежурный понимает, что делать.

Что такое Prometheus

Что это

Prometheus — система мониторинга, которая собирает числовые метрики с приложений и инфраструктуры, хранит их как временные ряды и помогает понять, что происходит с сервисом во времени.

Prometheus проще всего понять через путь сигнала. Сервис или экспортер публикует метрики, сервер их опрашивает, PromQL считает нужный срез, а правило решает, пора ли поднимать тревогу. На этом пути легко увидеть, где ломается система наблюдения: в плохой метке, шумном правиле, пропавшей цели или слишком дорогом количестве рядов.

Важно

Важно: Prometheus не заменяет логи, трассировку и дашборды. Он отвечает за числовые временные ряды и правила по ним. Для текста ошибок нужны системы журналов, для пути отдельного запроса — трассировка, для удобного экрана команды — Grafana или другой визуальный слой.

Механика / Работа

Как работает Prometheus от метрики до оповещения

У Prometheus есть понятная цепочка: сервис отдаёт метрики, сервер их опрашивает, PromQL выбирает нужные ряды, правила фиксируют агрегаты и отправляют сигналы.

Шаг Слой Смысл

Шаг 01

Слой

Сервис отдаёт метрики

Смысл

Приложение или экспортер публикует числовые показатели в формате, который понимает Prometheus.

Шаг 02

Слой

Prometheus опрашивает цели

Смысл

Сервер по расписанию забирает значения, добавляет метки и хранит их как временные ряды.

Шаг 03

Слой

PromQL отвечает на вопросы

Смысл

Запросы считают скорость, долю ошибок, задержку, насыщение ресурса и другие признаки состояния.

Шаг 04

Слой

Правила запускают реакцию

Смысл

Если условие держится дольше заданного времени, сигнал уходит в Alertmanager и дальше в канал дежурства.

Навык / Применение

Где используется Prometheus

Prometheus нужен там, где состояние системы должно быть измеримым. Сервисы меняются часто, узких мест много, а команда отвечает за доступность, скорость реакции и качество сигнала во время дежурства.

Сценарий 01

Метрики приложений

Ошибки, задержка, нагрузка и признаки деградации до первой жалобы.

Сценарий 02

Kubernetes и инфраструктура

Узлы, Pod, базы, очереди и ресурсные узкие места.

Сценарий 03

Оповещения и дежурства

Правила, которые ведут к понятному действию, а не к шуму.

Сценарий 04

SLO и стабильность

Измеримые цели по доступности, задержке и бюджету ошибок.

По направлениям

Prometheus заметен в 3 направлениях рынка с долей выше 5%.

Направление Контекст Доля Вакансии

Инфраструктура

Диагностика БД и служебные рабочие запросы.

52.6%

1 679

Разработка

Схема БД, запросы приложения и разбор производительности.

26.5%

847

Данные и ML

Трансформации, ETL и подготовка датасетов.

7.1%

228

Менеджмент

Самостоятельная проверка показателей и продуктовых гипотез.

4.2%

135

Направления показывают, в каких частях IT-рынка навык заметен чаще всего, без разбивки по ролям.

Инструмент / Возможности

Что нужно уметь в Prometheus

Рабочий Prometheus строится вокруг метрик, PromQL, правил и понимания цены лишних рядов.

Выбирать метрики

Отделять показатели, которые помогают действовать, от декоративных графиков.

Писать запросы

Считать скорость, процент ошибок, перцентили задержки и агрегаты по нужным меткам.

Настраивать оповещения

Собирать правила с понятным влиянием на сервис и без лишнего шума.

Контролировать кардинальность

Понимать, какие метки создают слишком много рядов и замедляют систему.

Сравнение / Контекст

Prometheus простыми словами

Если коротко, Prometheus — это измерительный слой: он регулярно снимает числовые показатели и позволяет спросить систему, что с ней происходит во времени. Важно не смешивать его с визуализацией, классическим серверным мониторингом и сбором всей телеметрии подряд.

Prometheus и Grafana

Prometheus собирает и считает метрики. Grafana читает их и показывает на экране.

Prometheus и Alertmanager

Prometheus решает, что горит. Alertmanager группирует и доставляет уведомления.

Метрики и логи

Метрики показывают числовой сигнал во времени, а логи дают текст событий и детали.

Локальное хранение и long-term слой

Для дежурства часто хватает локального окна Prometheus, а длинную историю уводят в отдельный внешний слой.

Данные / Стек

Какие данные попадают в Prometheus

Главный материал Prometheus — числовые метрики, привязанные ко времени и меткам. Мало просто снять число. Нужно ещё понять, как подписаны ряды и кто потом будет реагировать на сигнал. Одна лишняя метка с почти уникальным значением может резко раздуть хранилище и испортить запросы. Поэтому перед добавлением новой метрики обычно проверяют вопрос, источник, метки, интервал опроса и владельца реакции.

Метрики приложения

Запросы, ошибки, задержки, очереди, время обработки и внутренние счётчики.

Метрики инфраструктуры

Процессор, память, диск, сеть, состояние узлов и контейнеров.

Метрики платформы

Состояние Kubernetes, баз данных, балансировщиков, очередей и других систем.

Служебные метки

Имя задания, экземпляр, сервис, окружение и другие метки, по которым PromQL отделяет один источник сигнала от другого.

Сравнение / Инструменты

Prometheus, Grafana, Zabbix и OpenTelemetry

Эти инструменты часто встречаются рядом, но отвечают за разные части наблюдаемости.

Инструмент За что отвечает Когда нужен Граница

Prometheus

Сбор, хранение и запросы по временным рядам.

Когда нужно измерять состояние сервисов и инфраструктуры.

Не заменяет логи и трассировку.

Grafana

Панели, дашборды и единый экран команды.

Когда нужно показать данные Prometheus и других источников.

Не собирает метрики и не проектирует правила.

Zabbix

Классический мониторинг хостов и готовых проверок.

Когда важны серверы, шаблоны и централизованная эксплуатация.

Слабее работает с сервисными метриками и PromQL-подходом.

OpenTelemetry

Инструментация и передача метрик, логов и трасс.

Когда нужен общий способ собирать телеметрию в разных сервисах.

Не заменяет сам Prometheus как хранилище и query-слой.

Карьера / Роли

Кому нужен Prometheus

Prometheus переносится между ролями: DevOps-инженер, Go-разработчик, Java-разработчик. В одном треке этот навык может быть основным рабочим инструментом, а в другом - сильным прикладным усилителем основной специализации.

Роли с навыком

DevOps-инженер держит 145.8% вакансий по навыку.

Роль Вакансии Медиана

DevOps-инженер

1 044

—

Go-разработчик

219

—

Java-разработчик

180

—

Системный администратор

179

—

SRE-инженер

170

—

Python-разработчик

164

—

Инженер поддержки

103

—

Сетевой инженер

—

Ещё 7 ролей используют Prometheus

Практика / Задачи

Частые задачи с Prometheus

Prometheus ценен не абстрактным знанием инструмента, а повторяющимися рабочими задачами: быстро получить ответ, проверить расхождение, подготовить рабочий слой для команды и довести решение до результата.

# Задача Что делает специалист

Задача 01

Задача

Подключить метрики сервиса

Что делает специалист

Настроить цель опроса и проверить, что метрики отражают ошибки, задержки и нагрузку.

Задача 02

Задача

Написать рабочий PromQL-запрос

Что делает специалист

Собрать выражение, которое объясняет проблему: где деградация, насколько она сильная и кого затрагивает.

Задача 03

Задача

Собрать правило оповещения

Что делает специалист

Задать условие и время выдержки так, чтобы команда получала сигнал о проблеме, а не поток случайных уведомлений.

Задача 04

Задача

Разобрать пропавшие метрики

Что делает специалист

Проверить цель, экспортер, сетевой доступ, метки и то, не устарел ли запрос после изменения сервиса.

Задача 05

Задача

Снизить стоимость хранения

Что делает специалист

Найти метки, которые создают лишние ряды, и оставить только измерения, нужные для диагностики.

Задача 06

Задача

Связать сигнал с SLO

Что делает специалист

Перевести техническую метрику в понятный показатель качества сервиса.

Практика / Ошибки

Ошибки новичков

Ошибка 01

Считать Prometheus заменой Grafana

Это разные слои: Prometheus собирает и считает метрики, Grafana помогает их показывать.

Ошибка 02

Добавлять метки без ограничения

Метки с идентификаторами пользователей, заказов или запросов быстро раздувают число рядов и делают систему дорогой.

Ошибка 03

Делать оповещение по каждому скачку

Хорошее правило учитывает длительность, масштаб, влияние на пользователя и понятный порядок реакции.

Ошибка 04

Учить PromQL отдельно от инцидентов

Запрос полезен, когда помогает принять решение во время реальной деградации.

Рынок / Контекст

Почему Prometheus востребован

Prometheus стал привычным слоем метрик в облачной и контейнерной инфраструктуре. Но рынок ценит не установку сервера, а умение проектировать полезные метрики и тихие оповещения. Навык особенно заметен там, где команда отвечает за сервисы с реальной эксплуатацией: API, кластеры, очереди, базы, фоновые задачи и внутренние платформы. Чем дороже простой, тем важнее качество сигнала. Красивый график без пользы для дежурного уже никого не впечатляет. Сейчас ценят не картинку, а понятный маршрут реакции. И способность быстро отделить реальную тревогу от шума. Это уже часть инженерной зрелости команды. Именно поэтому хороший сигнал ценят выше красивой панели.

Сокращает ручную работу

Prometheus востребован там, где инструмент реально ускоряет повторяемые задачи команды, а не существует отдельной теорией.

Встроен в рабочий процесс

Спрос держится дольше, когда навык нужен не эпизодически, а как часть ежедневного цикла разработки, проверки или доставки.

Закреплён в зрелом стеке

Prometheus чаще ищут там, где процесс уже стандартизирован и без этого инструмента команда теряет скорость и предсказуемость.

Сигнал рынка

Высокий спрос

Prometheus стабильно удерживается в активном прикладном слое рынка.

Рынок / Спрос

Спрос на Prometheus на рынке

Prometheus сохраняет высокий текущий спрос на рынке: 716 активных вакансий, #21 по рынку, 9.2% IT-вакансий. Ниже показано число открытых вакансий на конец каждого месяца: это исторический ряд по состоянию на конец месяца, а не текущий срез рынка на сегодня.

Сила спроса

Высокий спрос

716

активных вакансий сейчас

#21 по рынку • 9.2% IT-вакансий

Месяц к месяцу

856

июнь 2026

+7 вакансий и +1% к предыдущему месяцу.

Доход / Уровни

Сколько платят специалистам с Prometheus

Prometheus усиливает доход в ролях, где человек отвечает за надёжность сервиса, дежурство и эксплуатацию. Сам по себе инструмент редко продаётся отдельно. Ценность появляется вместе с Linux, Kubernetes, сетями, SRE-практикой и умением...

Медиана рынка

Ограниченная точность

287 000

₽ / месяц

91 активных вакансий с зарплатой • покрытие 12.2% зарплатной выборки

Коридор по грейдам

333 000 - 333 000

₽ / месяц

Senior → Senior

Основной уровень

Senior

по структуре рынка

Senior - основной уровень рынка (54%)

Вход / Старт

Порог входа

Сейчас на рынке 23 активных junior-вакансий с Prometheus. Это 4% всех вакансий по навыку, поэтому для старта важнее всего смотреть на реальный объём junior-окна и на стек, который рынок ждёт рядом.

Junior-вакансии сейчас

активных вакансий

4% всех вакансий по навыку • Senior / Junior 13.5x

Доля junior

% всех вакансий по навыку

Окно входа узкое: рынок чаще нанимает с опытом.

Что нужно на старте

Стартовый стек

навыков в медианной вакансии

Медианная вакансия с Prometheus ожидает около 20 навыков в стеке. Это широкий стартовый набор: рынок обычно ищет не один изолированный инструмент, а рабочую комбинацию соседних навыков.

Чаще всего требуют вместе

навыки из junior-вакансий, где встречается Prometheus

Навык Junior-вакансии

Grafana

Docker

Kubernetes

PostgreSQL

Python

Linux

Связи / Навыки

Навыки в связке с Prometheus

Prometheus редко живёт изолированно: чаще всего рынок видит его рядом с Grafana, Kubernetes, Docker. Самая плотная связка сейчас - Grafana: оба навыка встречаются вместе в 87% вакансий.

Главная связка: Grafana • 87% вакансий. Показываем общерыночные связки Prometheus: не junior-минимум из блока выше, а навыки, которые чаще всего встречаются рядом с ним в одной вакансии.

Рабочий стек вокруг Prometheus

навыки, которые рынок чаще всего видит рядом в одной вакансии

Навык Зачем рядом Доля

Grafana

Одна из самых плотных рыночных связок рядом с Prometheus.

87%

Kubernetes

Часто встречается рядом с Prometheus в одном рабочем сценарии.

71%

Docker

Часто встречается рядом с Prometheus в одном рабочем сценарии.

66%

PostgreSQL

Поддерживает соседние процессы и усиливает рабочий контур навыка.

64%

CI/CD

Поддерживает соседние процессы и усиливает рабочий контур навыка.

60%

Linux

Поддерживает соседние процессы и усиливает рабочий контур навыка.

57%

Связки, которые усиливают доход

не базовый минимум, а более сильные комбинации стека

ELK Stack

n = 38

+21% 347 000 ₽

RabbitMQ

n = 33

+12% 322 000 ₽

Apache Kafka

n = 40

+12% 321 000 ₽

Redis

n = 34

+12% 321 000 ₽

Обучение / Маршрут

Как изучить Prometheus

Учить Prometheus лучше на живом сервисе. Сначала поднять цель опроса и увидеть метрики. Потом написать несколько запросов PromQL и собрать одно правило, которое действительно ведёт к действию. Такой путь быстрее показывает главное: метрика должна отвечать на рабочий вопрос, а не просто существовать. Уже после этого полезно разбирать retention, remote write и длинную историю хранения. Иначе документация читается, а сигнал так и не становится рабочим. Хорошо помогает и небольшой учебный сбой с реальной проверкой оповещения. После него проще понять цену плохого правила. И видно, почему команда так много говорит о шуме.

Этап Фокус Что изучать

Этап 01

Фокус

Цели опроса и метрики

Что изучать

Разобраться с форматом метрик, целями, экспортерами, интервалом опроса и устройством временных рядов.

Этап 02

Фокус

PromQL и правила

Что изучать

Научиться писать запросы, правила записи и правила оповещений для конкретных рабочих вопросов.

Этап 03

Фокус

Качество мониторинга

Что изучать

Контролировать число уникальных рядов, пропавшие цели, ложные сигналы и шум уведомлений.

Этап 04

Фокус

Соседний стек

Что изучать

Связать Prometheus с Grafana, Alertmanager, Kubernetes, OpenTelemetry, логами и процессом дежурств.

Практика / Первый запуск

С чего начать Prometheus

Старт должен быстро привести к рабочему сигналу. Поднимите одну цель опроса, проверьте страницу targets, выполните три простых запроса и соберите одно оповещение. Затем намеренно остановите сервис или испортите метку и посмотрите, как меняется поведение системы. Так становится ясно, где Prometheus помогает, а где мониторинг только делает вид, что всё спокойно. Такой учебный сбой даёт намного больше, чем длинный набор готовых дашбордов. Он сразу связывает метрику с реальной реакцией дежурного. И показывает, как быстро может появиться шум. После этого alerting воспринимается уже совсем по-другому.

Шаг 01

Поднимите одну цель опроса

Возьмите приложение или node exporter и убедитесь, что Prometheus видит метрики.

Шаг 02

Напишите три запроса

Проверьте частоту запросов, долю ошибок и задержку за несколько минут.

Шаг 03

Соберите одно правило

Настройте условие, которое сообщает о реальной деградации, и проверьте его вручную.

Шаг 04

Проверьте шум и метки

Посмотрите, не создаёт ли сервис лишние ряды и не срабатывает ли правило на краткий всплеск без пользовательского влияния.

Старт / Документация

Официальные ресурсы и быстрый старт

Для инструментов вроде Prometheus на одной странице полезно держать и объяснение роли на рынке, и быстрые переходы к официальным ресурсам.

Не путать с

Prometheus — рабочий инструмент или платформа, а не вся инженерная практика целиком.

Первый практический шаг

Лучший вход в Prometheus — один живой рабочий процесс, где видно не интерфейс, а реальное поведение инструмента.

Что открыть дальше

После короткого объяснения переходите к официальной документации, одному туториалу и одному живому примеру по Prometheus.

Будущее / Роль

Перспективы Prometheus

Перспективы Prometheus завязаны не только на текущем спросе, но и на том, как навык встраивается в новые платформы, инструменты и рабочие контуры.

Сигнал 01

Prometheus останется базовым слоем метрик

Пока команды эксплуатируют распределённые сервисы, им нужны временные ряды, запросы и правила.

Сигнал 02

Сильнее будет цениться проектирование сигналов

Рынок быстрее отличает инженера, который понимает качество метрик, от того, кто только ставит готовый стек.

Сигнал 03

Автоматизация поможет с запросами, но не с ответственностью

Инструменты могут предложить выражение, но порог, смысл сигнала и порядок реакции остаются инженерным решением.

Частые вопросы

Вопросы и ответы

Что такое Prometheus простыми словами?

Prometheus — это система для сбора, хранения и анализа числовых метрик. Она помогает понять, как ведут себя сервисы и инфраструктура во времени, и подать сигнал, когда состояние выходит за норму. Это один из базовых инструментов рабочего мониторинга.

Чем Prometheus отличается от Grafana?

Prometheus собирает и считает метрики, а Grafana показывает их на дашбордах. На практике они чаще работают вместе, а не заменяют друг друга. Спорить, что из них лучше, обычно просто бессмысленно. Это разные роли внутри одного контура.

Зачем нужен PromQL?

PromQL — это язык запросов к метрикам Prometheus. Им считают скорость ошибок, задержку, агрегаты по меткам и условия, по которым должно сработать оповещение. Без него система превращается в склад чисел без рабочего смысла. Именно через PromQL метрика начинает отвечать на вопрос команды.

Что делает Alertmanager?

Alertmanager принимает сигналы от Prometheus, группирует похожие уведомления, убирает повторы и отправляет их в нужный канал. Без него дежурство быстро тонет в шуме. Особенно это заметно во время одного большого сбоя с множеством зависимых сервисов.

Почему в Prometheus так опасны лишние метки?

Каждая новая комбинация меток создаёт отдельный временной ряд. Если в метки попадают почти уникальные значения, хранение дорожает, а запросы и правила начинают работать хуже. Поэтому кардинальность меток — одна из самых частых эксплуатационных ловушек. Ошибку тут обычно замечают уже после роста нагрузки.

С чего лучше начать изучение Prometheus?

С одного живого сервиса. Поднимите цель опроса, проверьте метрики, напишите несколько запросов и соберите одно понятное оповещение. Это даёт больше, чем обзор десятка экранов без практики, потому что сразу связывает цифру с реальной реакцией команды.