Prometheus: Мониторинг инфраструктуры 📊

Система предупреждения о проблемах до их возникновения.

Что контролирует:

  • 🖥️ Метрики серверов: CPU, RAM, диск, сеть через node_exporter
  • 🌐 Доступность сервисов: blackbox-проверки HTTP/TCP/ICMP
  • 📈 Сбор метрик из приложений: Nextcloud, Home Assistant и других
  • 🚨 Alertmanager: уведомления в Telegram/Discord при превышении порогов
  • 🔍 Мощные запросы через PromQL для глубокого анализа

Как это работает:

  1. Prometheus собирает метрики по расписанию (scrape)
  2. Вы видите графики в Grafana или настраиваете свои дашборды
  3. При аномалии срабатывает алерт - администратор получает уведомление

Для администраторов: Гибкие правила алертинга, запись правил (recording rules), федерация метрик, долгосрочное хранение через Thanos.

Доступ: через Grafana (grafana.potatoenergy.ru) • по учётным данным Potato Energy (управление - только по правам группы admin)