Monitoring & Logging

Мониторинг метрик и анализ логов с Prometheus и Grafana

Metrics Dashboard (Live Demo)

CPU Usage
0%
Memory Usage
0%
Requests/min
0
↑ 12% from last hour
Errors/min
0
↓ 5% from last hour
📊

Prometheus

Система мониторинга с time-series БД для сбора метрик

📈

Grafana

Визуализация метрик с красивыми дашбордами

📝

Loki

Агрегация и анализ логов от всех сервисов

Метрики для мониторинга

  • • CPU, Memory, Disk usage
  • • Request rate, latency
  • • Error rate (5xx, 4xx)
  • • Database connections
  • • Queue length

Типы алертов

  • • High CPU/Memory usage
  • • Service down/unreachable
  • • High error rate
  • • Slow response time
  • • Disk space low