Live-данные · обновлено 19 июля 2026 г.

Grafana

Grafana — платформа для визуализации метрик, логов и трейсов из любых источников данных. Инструмент №1 для мониторинга Kubernetes-кластеров: работает поверх Prometheus, Loki и Tempo в едином интерфейсе.

КВКузнецов Вячеслав·Технический редактор·DevOps/SRE-техлид · опыт 10+ лет

Вакансий

772

активных в Москве

Медиана зарплаты

262 тыс. ₽

n = 150 вакансий с указанной зарплатой

Индекс спроса

95/100

#16 из 332 навыков

Доля IT-рынка

11%

42 профессий

Каталог навыков Роли с Grafana Курсы

Коротко о навыке

Grafana — платформа наблюдаемости с открытым исходным кодом, которая объединяет метрики, логи и распределённые трейсы в единые дашборды. DevOps-инженеры и SRE используют её для оперативного мониторинга Kubernetes-кластеров и микросервисной архитектуры: система позволяет за секунды найти первопричину инцидента, не переключаясь между разрозненными инструментами.

Grafana подключается к любым источникам данных — Prometheus для метрик, Loki для логов, Tempo для трейсов, PostgreSQL и ClickHouse для аналитики. Встроенный Alerting-движок автоматически уведомляет дежурного инженера при нарушении пороговых значений и интегрируется с PagerDuty, Slack и OpsGenie. На российском рынке это один из ключевых навыков DevOps-специалиста: в вакансиях Grafana почти всегда соседствует с Prometheus.

Что такое Grafana

Что делает

Визуализирует метрики, логи и трейсы из десятков источников в едином интерфейсе — от Prometheus и Loki до PostgreSQL и ClickHouse.

Кто использует

DevOps-инженеры и SRE для мониторинга Kubernetes-кластеров, настройки алертов и расследования инцидентов в продакшен-среде.

Рынок

Один из самых частых навыков DevOps-вакансий: в требованиях почти всегда стоит вместе с Prometheus и Kubernetes, а медианы зарплат в этих ролях — среди самых высоких на рынке.

Grafana — не хранилище, а слой отображения

Grafana не собирает и не хранит метрики или логи — она подключается к внешним источникам через Data Sources и строит визуализацию поверх них. Prometheus хранит временные ряды и отвечает за сбор данных, Grafana — только за отображение и алертинг. Разделение позволяет подключить десятки разнородных источников к одному интерфейсу без миграции данных.

Три столпа наблюдаемости: метрики, логи, трейсы

Grafana поддерживает все три уровня наблюдаемости в едином интерфейсе. Prometheus и VictoriaMetrics дают метрики — числовые временные ряды. Loki собирает структурированные логи без предварительной индексации содержимого. Tempo хранит распределённые трейсы для анализа запросов через микросервисы. Совместное использование трёх слоёв даёт полную картину: что происходит, почему и где узкое место.

Alerting: от аномалии до уведомления

Grafana Alerting позволяет задать условия срабатывания прямо в интерфейсе: например, «CPU > 90% в течение 5 минут». При срабатывании система отправляет уведомление через Contact Points — Slack, PagerDuty, email или Telegram. Правила хранятся как YAML-код в Git и применяются через Grafana Provisioning — это основа Infrastructure as Code для мониторинга.

Механика / Работа

Как Grafana превращает данные в дашборд

Путь от метрики в Prometheus до алерта в Slack проходит через несколько слоёв. Grafana — только визуальная часть этого пути, но именно она делает данные читаемыми.

Шаг Слой Смысл

Шаг 01

Сбор метрик

Prometheus отправляет запросы к /metrics endpoint каждого сервиса (scrape). Данные хранятся как временные ряды с labels.

Шаг 02

Запрос через PromQL

Grafana отправляет PromQL-запрос к Prometheus при загрузке или обновлении панели. Prometheus вычисляет агрегацию и возвращает данные.

Шаг 03

Визуализация панели

Grafana рендерит полученные данные в выбранном типе панели: временной ряд, тепловая карта, таблица или Stat-виджет.

Шаг 04

Алерт при нарушении порога

Alerting-движок периодически выполняет Alert Rules. При нарушении порога — отправляет уведомление через Contact Point в Slack или PagerDuty.

Карьера / Роли

Кому нужен Grafana

Grafana переносится между ролями: DevOps-инженер, Инженер поддержки, Системный администратор. В одном треке этот навык может быть основным рабочим инструментом, а в другом - сильным прикладным усилителем основной специализации.

Роли с Grafana за период

DevOps-инженер — самый заметный профиль в распределении ролей по навыку.

Роль Упоминаний за период Медиана

DevOps-инженер

853

279 000 ₽

Инженер поддержки

188

—

Системный администратор

176

—

Ручной тестировщик

152

—

SRE-инженер

152

—

Go-разработчик

145

—

Бэкенд-разработчик

118

—

Java-разработчик

108

—

Ещё 7 ролей используют Grafana

Текущий срез показывает активные вакансии сейчас. Распределение по ролям рассчитано по расширенной исторической выборке, поэтому значения могут быть выше текущего количества активных вакансий.

Практика / Задачи

Частые задачи с Grafana

Grafana ценен не абстрактным знанием инструмента, а повторяющимися рабочими задачами — ниже они разобраны так, как встречаются в реальной работе.

# Задача Что делает специалист

Задача 01

Запрос HTTP-ошибок через PromQL

Типовой golden signal — процент HTTP-ошибок за последние 5 минут.

sum(rate(http_requests_total{status=~"5.."}[5m]))
/ sum(rate(http_requests_total[5m])) * 100

Задача 02

P99-латентность через histogram_quantile

Запрос для анализа хвостовой латентности — ключевой SLO-индикатор производительности.

histogram_quantile(0.99,
  sum(rate(http_request_duration_seconds_bucket[5m]))
  by (le, service)
)

Задача 03

LogQL: фильтрация ошибок из контейнера

Выборка только ошибок из логов Loki для конкретного сервиса в продакшене.

{namespace="production", container="api"}
  |= "error"
  | json
  | level="error"

Задача 04

Дашборд через Provisioning

Хранение дашборда как кода — основа Infrastructure as Code для мониторинга.

# grafana/provisioning/dashboards/dashboards.yaml
apiVersion: 1
providers:
  - name: default
    type: file
    options:
      path: /var/lib/grafana/dashboards

Задача 05

Alert Rule в Grafana Alerting

Правило для уведомления при высоком потреблении CPU в продакшен-кластере.

# alert rule expression (PromQL)
avg(
  rate(container_cpu_usage_seconds_total[5m])
) by (pod) > 0.9

Задача 06

Grafana Data Source через Terraform

Управление источниками данных как инфраструктурным кодом через Terraform-провайдер Grafana.

resource "grafana_data_source" "prometheus" {
  type       = "prometheus"
  name       = "Prometheus"
  url        = "http://prometheus:9090"
  is_default = true
}

Практика / Ошибки

Ошибки новичков

Ошибка 01

Хранить дашборды только в UI

Дашборды, созданные через веб-интерфейс без Provisioning, теряются при пересоздании контейнера Grafana. Любое изменение дашборда должно экспортироваться в JSON и коммититься в Git.

Ошибка 02

Писать алерты без SLO

Алерт «CPU > 80%» без контекста — источник ложных срабатываний. Правильная основа: golden signals (латентность, ошибки, трафик, насыщение ресурсов) привязанные к SLO сервиса.

Ошибка 03

Игнорировать cardinality метрик

Метрики с высоким числом уникальных значений labels (например, user_id или request_id) вызывают экспоненциальный рост нагрузки на Prometheus и замедление запросов в Grafana.

Ошибка 04

Один дашборд на всё

Дашборд из 50+ панелей становится нечитаемым и медленным. Правило: один дашборд — одна зона ответственности. Навигация между дашбордами через встроенные ссылки.

Рынок / Контекст

Grafana в современных IT-проектах: контекст спроса

Grafana — один из самых востребованных инструментов наблюдаемости на российском IT-рынке. В вакансиях он почти всегда идёт вместе с Prometheus: стек Prometheus+Grafana стал де-факто стандартом для инженеров по эксплуатации. Доминирующая роль — DevOps-инженер; следом идут SRE и инженеры по инфраструктуре. Grafana также присутствует в вакансиях разработчиков уровня Senior, которые несут ответственность за наблюдаемость собственных сервисов. Рост интереса к Grafana связан с массовым переходом компаний на Kubernetes: без мониторинга кластер неуправляем.

Сокращает путь от сигнала к действию

Grafana востребована там, где команда должна быстро увидеть симптом, проверить соседние сигналы и понять следующий шаг.

Встроена в дежурство и релизы

Навык ценят не за красивые графики, а за рабочие панели, алерты и переход от метрики к разбору инцидента.

Держится рядом с observability-стеком

Grafana чаще ищут вместе с Prometheus, Kubernetes, логами, трассировками и инфраструктурой, где без общего экрана команда теряет скорость.

Сигнал рынка

Высокий спрос

Grafana стабильно удерживается в активном прикладном слое рынка.

Рынок / Спрос

Спрос на Grafana на рынке

Grafana сохраняет высокий текущий спрос на рынке: 772 активных вакансий, #16 по рынку, 11% IT-вакансий. Ниже показано число открытых вакансий на конец каждого месяца: это исторический ряд по состоянию на конец месяца, а не текущий срез рынка на сегодня.

Сила спроса

Высокий спрос

772

активных вакансий сейчас

#16 по рынку • 11% IT-вакансий

Месяц к месяцу

975

июль 2026 — предварительный накопительный срез

-116 вакансий и -11% к предыдущему месяцу.

Доход / Уровни

Зарплаты в вакансиях, где требуется Grafana

Зарплату определяет роль, а не инструмент: Grafana чаще всего спрашивают с DevOps-инженеров и SRE — специализаций с одними из самых высоких медиан на рынке. Разрыв между Middle и Senior здесь относительно небольшой: рынок ценит...

Медиана рынка

Рабочий сигнал

262 000

₽ / месяц

150 вакансий с зарплатой в расширенной зарплатной выборке

Коридор по грейдам

230 000 - 310 000

₽ / месяц

Middle → Senior

Основной уровень

Senior

по структуре рынка

Senior - основной уровень рынка (53%)

Связи / Навыки

Навыки в связке с Grafana

Grafana редко живёт изолированно: чаще всего рынок видит его рядом с Prometheus, Kubernetes, Docker. Самая плотная связка сейчас - Prometheus: оба навыка встречаются вместе в 67% вакансий.

Главная связка: Prometheus • 67% вакансий. Показываем общерыночные связки Grafana: не junior-минимум из блока выше, а навыки, которые чаще всего встречаются рядом с ним в одной вакансии.

Рабочий стек вокруг Grafana

навыки, которые рынок чаще всего видит рядом в одной вакансии

Навык Зачем рядом Доля

Prometheus

Сбор и хранение метрик, которые Grafana читает для дашбордов и алертов.

67%

Kubernetes

Контекст кластеров: узлы, поды, сервисы, лимиты, рестарты и состояние workload.

62%

Docker

Контейнерный слой, где Grafana помогает видеть сервисы, ресурсы и окружения.

57%

PostgreSQL

Источник SQL-данных и объект мониторинга для технических или операционных панелей.

55%

CI/CD

Контекст релизов, деплоев и аннотаций, который помогает объяснить скачки на графиках.

55%

Linux

Сигналы хостов, процессов, дисков, сети и базовой эксплуатации серверов.

55%

Связки, которые усиливают доход

не базовый минимум, а более сильные комбинации стека

ClickHouse

n = 34

+26% 329 000 ₽

PostgreSQL

n = 90

+16% 305 000 ₽

Kubernetes

n = 75

+15% 300 000 ₽

Redis

n = 46

+12% 294 000 ₽

Вход / Старт

Порог входа

Сейчас на рынке 41 активных junior-вакансий с Grafana. Это 6.5% всех вакансий по навыку, поэтому для старта важнее всего смотреть на реальный объём junior-окна и на стек, который рынок ждёт рядом.

Junior-вакансии сейчас

активных вакансий

6.5% всех вакансий по навыку • Senior / Junior 8.1x

Доля junior

6.5%

% всех вакансий по навыку

Окно входа узкое: рынок чаще нанимает с опытом.

Что нужно на старте

Стартовый стек

навыков в медианной вакансии

Медианная вакансия с Grafana ожидает около 19 навыков в стеке. Это широкий стартовый набор: рынок обычно ищет не один изолированный инструмент, а рабочую комбинацию соседних навыков.

Чаще всего требуют вместе

навыки из junior-вакансий, где встречается Grafana

Навык Junior-вакансии

Linux

Kubernetes

PostgreSQL

Python

SQL

CI/CD

Карьера / Резюме

Grafana в резюме: что значит "знаю Grafana"

Что значит владение Grafana на каждом уровне и что показать в резюме. Этот навык чаще всего востребован в DevOps, SRE и администрировании, но может быть дополнительным для backend-разработчиков.

Уровень Что значит Что показать

Beginner

Может запустить Grafana через Docker, создать простой дашборд с одной панелью.

Пример дашборда с метриками CPU через Node Exporter.

Junior developer

Подключает несколько datasource (Prometheus, PostgreSQL), создаёт переменные, настраивает базовый алерт.

Дашборд мониторинга веб-сервера с алертом на Telegram.

Middle developer

Пишет сложные PromQL-запросы, использует Transformations, Templating, настраивает provisioning.

GitOps-репозиторий с provisioning конфигами и дашбордами.

QA automation

Интегрирует Grafana с K6/JMeter для визуализации тестов, настраивает алерты по порогам производительности.

Дашборд с результатами нагрузочных тестов и сравнением прогонов.

Data/ML

Визуализирует метрики обучения моделей, подключает SQL-базы, использует Grafana для мониторинга дрифта.

Дашборд с loss, accuracy и мониторингом данных.

DevOps junior

Разворачивает стопку Prometheus + Grafana, настраивает Node Exporter, импортирует готовые дашборды.

Полный стек мониторинга через Docker Compose.

SRE/platform

Управляет масштабированием Grafana, настраивает резервное копирование, интеграцию с Loki/Tempo, разграничение прав.

Enterprise-решение: кластеризация, SSL, HA, GitOps.

Навык / Применение

Где используется Grafana

Grafana применяется везде, где нужно видеть состояние системы в реальном времени — от одного сервера до тысяч микросервисов в Kubernetes-кластере.

Сценарий 01

Мониторинг Kubernetes

Дашборды для отслеживания нагрузки на поды, потребления памяти и CPU по неймспейсам, статуса деплоев и событий кластера. Стандартная связка: node-exporter +...

Сценарий 02

Анализ производительности сервисов

Tempo + Grafana даёт картину маршрута каждого запроса через микросервисы. Можно увидеть, на каком сервисе запрос тормозит и сколько времени занимает каждый шаг...

Сценарий 03

Алертинг и дежурства

Grafana Alerting настраивает правила для автоматических уведомлений при аномалиях. Интеграция с PagerDuty и OpsGenie позволяет строить ротацию дежурств инженеров на...

Сценарий 04

Бизнес-дашборды

Визуализация бизнес-метрик из PostgreSQL или ClickHouse: количество заказов, конверсии, выручка по сегментам. Те же инструменты и принципы, что и для технического...

По направлениям

Grafana заметен в 4 направлениях рынка с долей выше 5%.

Направление Контекст Доля

Инфраструктура

Мониторинг серверов, Docker, Kubernetes, облачных метрик.

50.9%

Разработка

Визуализация метрик приложений, алерты по latency и ошибкам.

21.2%

Тестирование

Часть спроса по навыку сосредоточена в этом направлении.

9.7%

Данные и ML

Часть спроса по навыку сосредоточена в этом направлении.

7.5%

Направления показывают, в каких частях IT-рынка навык заметен чаще всего, без разбивки по ролям.

Инструмент / Возможности

Что умеет DevOps-инженер с Grafana

Grafana — не просто красивые графики. Инженер со знанием инструмента строит полноценную систему наблюдаемости для продакшена.

Построить систему мониторинга

Развернуть Prometheus + Grafana для Kubernetes или отдельных сервисов. Настроить scrape-конфигурации, правила агрегации и политику хранения данных.

Написать PromQL-запросы

Рассчитать golden signals: ошибки, латентность p50/p95/p99, RPS и насыщенность ресурсов. Использовать histogram_quantile() для анализа распределения.

Настроить алертинг

Создать Alert Rules с правильными порогами и периодами оценки. Настроить маршрутизацию уведомлений по командам через Alertmanager или Grafana Alerting.

Управлять конфигурацией как кодом

Хранить дашборды и источники данных в Git через Provisioning. Применять Terraform для автоматизации создания ресурсов Grafana в CI/CD.

Сравнение / Контекст

Grafana vs конкуренты

Выбор платформы мониторинга зависит от стека, команды и бюджета.

Grafana vs Datadog

Datadog — SaaS с автоматической инструментацией из коробки, но дорогой при масштабировании. Grafana — self-hosted или Cloud, требует настройки, но даёт полный контроль и значительно дешевле на...

Grafana vs Kibana

Kibana специализируется на поиске и анализе логов в Elasticsearch. Grafana — универсальная платформа для метрик, логов и трейсов из разных источников. Для стека ELK — Kibana, для Prometheus и Loki —...

Grafana vs Zabbix

Zabbix — монолитная система мониторинга инфраструктуры с агентами и встроенным хранилищем. Grafana — слой визуализации без хранения. Zabbix популярен в корпоративных сетях, Grafana — стандарт для...

Инструмент / Оркестрация

Grafana + Prometheus + Node Exporter: запуск через Docker Compose

Этот стек — самый популярный способ начать мониторинг. Разберём конфигурацию для быстрой локальной установки с Docker Compose.

services: Prometheus, Node Exporter, Grafana

Три сервиса: Prometheus для сбора метрик, Node Exporter для аппаратных метрик хоста, Grafana для визуализации. Все контейнеры запускаются через одну команду `docker compose up -d`.

volumes: grafana_data

Том для хранения данных Grafana (дашборды, настройки). Без него при перезапуске контейнера конфигурация теряется. Подключается через `volumes:` в секции сервиса.

networks: default

Docker Compose создаёт сеть по умолчанию, через которую сервисы общаются по именам (prometheus:9090, grafana:3000). Для сложных конфигураций можно задать свою сеть.

depends_on

Не обязателен, но можно добавить для порядка, чтобы сервисы запускались строго после Prometheus. Для большинства сценариев достаточно `restart: unless-stopped`.

Пример: типовой стек мониторинга

Файл `docker-compose.yml` с тремя сервисами: Prometheus (порт 9090), Node Exporter (порт 9100), Grafana (порт 3000). После запуска добавить в Grafana Datasource Prometheus и импортировать стандартный...

Grafana: лучшие практики и ошибки новичков

Практика 01

Используйте Templating (Variables)

Вместо дублирования дашбордов для разных серверов создайте переменную `$host` и примените в запросе. Это уменьшает количество дашбордов и упрощает поддержку.

Практика 02

Применяйте аннотации

Добавляйте на дашборды отметки о релизах, чтобы видеть корреляцию изменений с пиками метрик. Используйте API для автоматического добавления аннотаций при деплое.

Практика 03

Настраивайте алерты с правильными интервалами

Не ставьте `for: 0s` — иначе будете получать ложные тревоги на кратковременные скачки. Для production используйте `for: 5m`, чтобы отфильтровать случайные всплески.

Практика 04

Храните дашборды в Git

Используйте provisioning и GitOps — это защитит от потери конфигурации при сбое. Выгружайте дашборды в JSON и версионируйте в репозитории.

Практика 05

Ограничивайте права доступа

Разграничивайте редакторов и зрителей через Teams и Roles. Назначайте роли Viewer, Editor и Admin с учётом необходимости доступа к конкретным папкам.

Практика 06

Избегайте слишком большого количества панелей

Графики перестают читаться. Делайте по одному дашборду на сервис. Используйте переменные для переключения хостов, а не дублируйте панели.

Практика 07

Используйте `$__rate_interval` в PromQL

PromQL без учёта интервала даёт неточные значения для счётчиков. Используйте `rate(metric[$__rate_interval])`, чтобы получить корректные средние значения.

Практика 08

Не храните секреты в дашбордах

Пароли и токены в переменных дашборда — уязвимость. Используйте environment variables и provisioning с подстановкой секретов из безопасного хранилища.

Практика / Безопасность

Безопасность Grafana: что нельзя делать

Риск 01

Не оставляйте логин admin с паролем по умолчанию

Сразу смените `GF_SECURITY_ADMIN_PASSWORD` при развёртывании. Используйте сложный пароль или настройте OAuth/SSO для входа.

Риск 02

Не открывайте порт 3000 в интернет без авторизации

Используйте обратный прокси (Nginx) с HTTPS и OAuth. Закрывайте прямой доступ к Grafana из внешней сети.

Риск 03

Не используйте токены API с неограниченным сроком

Настройте Service Account с минимальными правами и ограничьте по времени. Регулярно ротируйте ключи доступа.

Риск 04

Не храните чувствительные переменные в дашбордах

Для секретов используйте provisioning с environment substitution. Избегайте хранения паролей и токенов в plain text в конфигах.

Риск 05

Не давайте права Admin обычным пользователям

Используйте Viewer или Editor с ограниченным доступом к определённым папкам. Администраторские права должны быть только у DevOps/SRE.

Риск 06

Не отключайте аудит

Для аудита действий пользователей в Grafana Enterprise используйте [auditing] enabled = true. В OSS-версии полноценного audit trail нет — только уровень детализации логов через GF_LOG_LEVEL.

Риск 07

Не используйте Grafana в изоляции без обновлений

Следите за CVE, особенно для плагинов. Регулярно обновляйте Grafana до последней стабильной или LTS версии.

Риск 08

Ограничьте использование `privileged` режимов

Для Node Exporter используйте `privileged: true` только если необходим доступ к системным метрикам. В остальных случаях отдавайте предпочтение минимальным привилегиям.

Будущее / Роль

Перспективы Grafana

Перспективы Grafana завязаны не только на текущем спросе, но и на том, как навык встраивается в новые платформы, инструменты и рабочие контуры.

Сигнал 01

Grafana Beyla: автоматическая инструментация через eBPF

Beyla использует eBPF для автоматического сбора метрик и трейсов без изменения кода приложения. Ключевой тренд для снижения порога входа в наблюдаемость.

Сигнал 02

OpenTelemetry как единый стандарт

Grafana полностью интегрируется с OpenTelemetry — вендор-нейтральным стандартом для инструментации. OTel становится основным форматом для трейсов и метрик в новых проектах.

Сигнал 03

Grafana Cloud и переход на SaaS

Grafana Cloud предлагает управляемый стек наблюдаемости без операционной нагрузки. Тренд на SaaS-мониторинг ускоряется — особенно для небольших команд без выделенного SRE.

Практика / Портфолио

Портфолио с Grafana: с чего начать

Проект 01

Мониторинг Kubernetes-кластера

Поднять Prometheus + Grafana через kube-prometheus-stack (Helm). Создать дашборды для golden signals каждого сервиса. Настроить Alertmanager с уведомлениями в Telegram.

Проект 02

Полный стек наблюдаемости

Prometheus + Loki + Tempo + Grafana через Docker Compose. Инструментировать приложение OpenTelemetry. Создать коррелированный дашборд: метрика → лог → трейс одного запроса.

Обучение / Маршрут

Как изучить Grafana

Grafana изучают в контексте всего DevOps-стека, а не изолированно. Отдельно от Prometheus и Kubernetes инструмент почти не применяется в коммерческих проектах. Поэтому оптимальный путь — начать с Prometheus и понять модель данных временных рядов, а затем подключить Grafana как слой визуализации. Для освоения PromQL потребуется две-три недели практики. Дашборды для Kubernetes строятся по готовым шаблонам (grafana.com/dashboards), что даёт быстрый старт без написания запросов с нуля. Alerting и Provisioning — следующий уровень, необходимый для продакшен-готовности системы мониторинга.

Этап Фокус Что изучать

Этап 01

Prometheus и модель метрик

Понять, что такое временной ряд, labels и scrape. Поднять Prometheus локально, настроить scrape_config для node_exporter. Основа — без неё Grafana теряет...

Этап 02

Базовый PromQL

Изучить rate(), sum by(), histogram_quantile(). Написать первые запросы: HTTP-запросы в секунду, p99-латентность, процент ошибок (golden signals). Это...

Этап 03

Первый дашборд в Grafana

Подключить Prometheus как Data Source. Создать панели с временными рядами, таблицами и Stat-виджетами. Добавить переменные для фильтрации по сервису и...

Этап 04

Loki и LogQL

Подключить Loki для сбора логов из контейнеров. Научиться коррелировать метрики и логи на одном дашборде. LogQL проще PromQL — основные паттерны...

Курсы · по данным рынка

Курсы по Grafana

Соответствие — доля тем навыка, которые охватывает программа курса

Все курсы по навыку Grafana

Практика / Первый запуск

С чего начать изучение Grafana

Grafana осваивается быстро при правильном порядке: сначала данные в Prometheus, потом визуализация. Попытка изучить Grafana без реальных данных приводит к тупику — в демо-режиме сложно понять ценность инструмента и смысл запросов.

Шаг 01

Поднять Prometheus + Grafana через Docker Compose

Скопировать готовый docker-compose.yml с node_exporter, Prometheus и Grafana. Запустить docker compose up -d. Открыть localhost:3000 (Grafana) и localhost:9090 (Prometheus).

Шаг 02

Импортировать готовый дашборд

Перейти в Dashboards → Import. Ввести ID 1860 — Node Exporter Full, самый популярный дашборд для метрик сервера. Сразу получить рабочую визуализацию CPU, памяти, диска и сети.

Шаг 03

Написать первый PromQL-запрос

Создать новую панель. В Query Editor ввести: rate(node_cpu_seconds_total{mode!='idle'}[5m]). Выбрать Time series. Поиграть с периодом и агрегацией по методу sum().

Шаг 04

Настроить первый алерт

Перейти в Alerting → Alert Rules. Создать правило для высокого CPU. Добавить Contact Point с Telegram или Email. Проверить, что уведомление приходит при тестовом срабатывании.

Шаг 05

Освоить Provisioning

Экспортировать созданный дашборд в JSON. Сохранить в grafana/provisioning/dashboards/. Пересоздать контейнер Grafana — убедиться, что дашборд восстановился автоматически из файла.

Старт / Документация

Официальные ресурсы и быстрый старт

Если после объяснения нужно перейти к практике, начните с официальной документации Grafana, разделов про dashboards, data sources и alerting.

Официальный сайт

Grafana

Официальный сайт Grafana Labs.

Документация

About Grafana

Официальное описание Grafana: запросы, визуализация, Explore и alerting.

Документация

Grafana dashboards

Документация по дашбордам, панелям, запросам и преобразованию данных.

Документация

Data sources

Как Grafana подключается к Prometheus, Loki, SQL, облакам и другим источникам.

Документация

Grafana Alerting

Официальный раздел про правила, состояния алертов и маршрутизацию уведомлений.

Песочница

Grafana Play

Публичная demo-среда Grafana для просмотра готовых дашбордов.

Частые вопросы

Вопросы и ответы

Что такое Grafana простыми словами?

Grafana — программа для создания интерактивных дашбордов, которые показывают состояние серверов, сервисов и приложений в реальном времени. Она не хранит данные сама, а подключается к системам вроде Prometheus или базам данных и отображает их на графиках.

Зачем Grafana, если есть Prometheus?

Prometheus хранит метрики и умеет отправлять алерты, но его встроенный интерфейс минимален. Grafana — слой визуализации поверх Prometheus: удобные дашборды, переменные, смешивание нескольких источников данных. Стек Prometheus+Grafana используется вместе, а не вместо друг друга.

Чем Grafana отличается от Kibana?

Kibana — инструмент для поиска и анализа логов в Elasticsearch (стек ELK). Grafana — универсальная платформа для метрик, логов и трейсов из десятков источников. Если стек ELK — Kibana, если Prometheus и Loki — Grafana.

Как начать изучать Grafana с нуля?

Сначала поднять Prometheus с node_exporter локально через Docker Compose. Подключить Grafana и создать первый дашборд с метриками хоста. Затем изучить PromQL — базовые функции rate(), sum(), histogram_quantile(). Официальная документация grafana.com/docs — лучший источник.

Нужно ли знать программирование, чтобы работать с Grafana?

Для базовой работы — нет. Дашборды создаются через визуальный интерфейс. Для продвинутого мониторинга нужен PromQL или LogQL — это языки запросов, не полноценное программирование. Terraform изучается при необходимости управления конфигурацией как кодом.

Сколько зарабатывают DevOps-инженеры с Grafana?

Зарплату определяет роль и весь стек, а не один инструмент: Grafana входит в обязательный набор навыков DevOps-инженера и SRE — специализаций с одними из самых высоких медиан на рынке. Актуальные зарплатные данные по ролям смотрите в рыночном блоке этой страницы.

Grafana

Коротко о навыке

Что такое Grafana

Что делает

Кто использует

Рынок

Grafana — не хранилище, а слой отображения

Три столпа наблюдаемости: метрики, логи, трейсы

Alerting: от аномалии до уведомления

Как Grafana превращает данные в дашборд

Кому нужен Grafana

Роли с Grafana за период

Частые задачи с Grafana

Ошибки новичков

Хранить дашборды только в UI

Писать алерты без SLO

Игнорировать cardinality метрик

Один дашборд на всё

Grafana в современных IT-проектах: контекст спроса

Сокращает путь от сигнала к действию

Встроена в дежурство и релизы

Держится рядом с observability-стеком

Спрос на Grafana на рынке

Зарплаты в вакансиях, где требуется Grafana

Навыки в связке с Grafana

Рабочий стек вокруг Grafana

Связки, которые усиливают доход

Порог входа

Стартовый стек

Чаще всего требуют вместе

Grafana в резюме: что значит "знаю Grafana"

Где используется Grafana

Мониторинг Kubernetes

Анализ производительности сервисов

Алертинг и дежурства

Бизнес-дашборды

По направлениям

Что умеет DevOps-инженер с Grafana

Построить систему мониторинга

Написать PromQL-запросы

Настроить алертинг

Управлять конфигурацией как кодом

Grafana vs конкуренты

Grafana vs Datadog

Grafana vs Kibana

Grafana vs Zabbix

Grafana + Prometheus + Node Exporter: запуск через Docker Compose

services: Prometheus, Node Exporter, Grafana

volumes: grafana_data

networks: default

depends_on

Пример: типовой стек мониторинга

Рекомендации по production

Grafana: лучшие практики и ошибки новичков

Используйте Templating (Variables)

Применяйте аннотации

Настраивайте алерты с правильными интервалами

Храните дашборды в Git

Ограничивайте права доступа

Избегайте слишком большого количества панелей

Используйте `$__rate_interval` в PromQL

Не храните секреты в дашбордах

Безопасность Grafana: что нельзя делать

Не оставляйте логин admin с паролем по умолчанию

Не открывайте порт 3000 в интернет без авторизации

Не используйте токены API с неограниченным сроком

Не храните чувствительные переменные в дашбордах

Не давайте права Admin обычным пользователям

Не отключайте аудит

Не используйте Grafana в изоляции без обновлений

Ограничьте использование `privileged` режимов

Перспективы Grafana

Grafana Beyla: автоматическая инструментация через eBPF

OpenTelemetry как единый стандарт

Grafana Cloud и переход на SaaS

Портфолио с Grafana: с чего начать

Мониторинг Kubernetes-кластера

Полный стек наблюдаемости

Как изучить Grafana

Курсы по Grafana