본문 바로가기

ETC DB12

prometheus Alert Manager Alert Manager 모니터링 시스템이니, 문제가 발생하면 이를 알람으로 보내주는 역할도 있어야한다. Alertmanager는 Prometheus에서 문제가 발생했다고 생각되는 시점에 slack, hipchat 등을 통해 알람을 보내준다. 알람을 거는 기준은 Rule을 작성해서 load시키는 방식으로 동작하는데 expr: job:request_latency_seconds:mean5m{job="myjob"} > 0.5 와 같이 expression을 작성하는 것으로 알람을 전송할 수 있다. 특정 메트릭의 값이 어느정도 선(threshold)을 넘는다거나, 낮아진다거나 하는 메트릭을 보고 판단을 할 수 있다. 다만, 이 또한 Grafana를 사용하게 된다면 Grafana에서도 동일하게 알람매니저를 제공을 .. 2021. 7. 22.
prometheus 실행 1. 프로메테우스 실행 > setproxy wget https://github.com/prometheus/prometheus/releases/download/v2.2.1/prometheus-2.2.1.linux-amd64.tar.gz > tar -xzf prometheus-2.2.1.linux-amd64.tar.gz > cd prometheus-2.2.1.linux-amd64/ > vi prometheus.yml prometheus.yml 파일에 scrape_configs 항목 추가 global: scrape_interval: 10s scrape_configs: - job_name: 'prometheus' static_configs: - targets: ['localhost:9090'] > ./ prom.. 2021. 7. 22.
prometheus TSDB format 용어사전 : chunk : 데이터가 저장되는 단위 tombstone : chunk 파일에서 데이터를 즉시 삭제하는 대신 삭제를 기록 WAL : 서버 재 시작이나 crash로 부터 보호를 위한 log symbol : 시리즈의 레이블 쌍에서 발생한 중복 제거 된 문자열 1. Index Disk Format 다음 각 블록 디렉토리에 있는 index 파일의 형식을 설명합니다 인덱스가 작성 될 때, 위의 줄이 그어진 메인 섹션 사이에 임의의 수의 패딩 바이트가 추가 될 수 있습니다. 파일을 순차적으로 스캔 할 때 섹션의 지정된 길이 뒤에 오는 0 바이트는 건너 뛰어야합니다. 아래에 설명 된 대부분의 섹션은 len필드로 시작 합니다. 항상 후행 CRC32 체크섬 바로 앞의 바이트 수를 지정합니다. 체크섬은 항상 해.. 2021. 7. 21.
prometheus TSDB 관리 API 고급 사용자를 위해 데이터베이스 관리 기능을 하는 API입니다. 이 API는이 --web.enable-admin-api 설정되어 있지 않으면 사용할 수 없습니다. 1. snapshot snapshot은 현재 모든 데이터의 snapshot을 TSDB의 데이터 디렉터리 아래 snapshots/- 에 만들고 응답으로 디렉터리를 반환합니다. 헤드 블록에만 있고 아직 디스크에 압축되지 않은 스냅 샷 데이터를 선택적으로 건너 뜁니다. POST /api/v1/admin/tsdb/snapshot PUT /api/v1/admin/tsdb/snapshot URL 쿼리 매개 변수 : skip_head= : 헤드 블록에 있는 데이터를 건너 뜁니다. (옵션) $ curl -XPOST http://localhost:9090/ap.. 2021. 7. 21.