alert manager1 prometheus Alert Manager Alert Manager 모니터링 시스템이니, 문제가 발생하면 이를 알람으로 보내주는 역할도 있어야한다. Alertmanager는 Prometheus에서 문제가 발생했다고 생각되는 시점에 slack, hipchat 등을 통해 알람을 보내준다. 알람을 거는 기준은 Rule을 작성해서 load시키는 방식으로 동작하는데 expr: job:request_latency_seconds:mean5m{job="myjob"} > 0.5 와 같이 expression을 작성하는 것으로 알람을 전송할 수 있다. 특정 메트릭의 값이 어느정도 선(threshold)을 넘는다거나, 낮아진다거나 하는 메트릭을 보고 판단을 할 수 있다. 다만, 이 또한 Grafana를 사용하게 된다면 Grafana에서도 동일하게 알람매니저를 제공을 .. 2021. 7. 22. 이전 1 다음