Prometheus: всевидящее око инфраструктуры

Мониторинговая платформа 📊 Назначение Круглосуточный контроль ключевых показателей: Доступность сервисов (HTTP/ICMP/DNS) Использование ресурсов (CPU/RAM/Диск) Аномальная активность SLA выполнения Техническая реализация Сбор метрик: 20s интервал Хранение: 30 дней ретеншена Пробы: Blackbox для 8 типов проверок Экспортеры: Node, cAdvisor, ASF, HA Безопасность и доступ Dashboard: potatoenergy.ru/prometheus (группа dev) Оповещения: Discord/Telegram для критических инцидентов Шифрование: TLS для всех экспортеров Аудит: Подпись метрик Особенности Автоматическое обнаружение аномалий Кастомные дашборды Grafana Интеграция с 15+ источниками данных Система эскалации инцидентов Система алертинга 🚨 Принципы работы ...

1 минута · 158 слов · Potato Energy Team, ponfertato