Prometheus: Мониторинг инфраструктуры 📊
Система предупреждения о проблемах до их возникновения.
Что контролирует:
- 🖥️ Метрики серверов: CPU, RAM, диск, сеть через node_exporter
- 🌐 Доступность сервисов: blackbox-проверки HTTP/TCP/ICMP
- 📈 Сбор метрик из приложений: Nextcloud, Home Assistant и других
- 🚨 Alertmanager: уведомления в Telegram/Discord при превышении порогов
- 🔍 Мощные запросы через PromQL для глубокого анализа
Как это работает:
- Prometheus собирает метрики по расписанию (scrape)
- Вы видите графики в Grafana или настраиваете свои дашборды
- При аномалии срабатывает алерт - администратор получает уведомление
Для администраторов: Гибкие правила алертинга, запись правил (recording rules), федерация метрик, долгосрочное хранение через Thanos.
Доступ: через Grafana (grafana.potatoenergy.ru) • по учётным данным Potato Energy (управление - только по правам группы admin)