토리맘의 한글라이즈 프로젝트 logo 토리맘의 한글라이즈 프로젝트

프로메테우스 공식 레퍼런스를 한글로 번역한 문서입니다.

전체 목차는 여기에 있습니다.


Pushgateway는 스크랩이 불가능한 job에 있는 메트릭을 푸시할 수 있게 해주는 중개 서비스다. 자세한 내용은 메트릭 푸시하기를 참고해라.

목차


Should I be using the Pushgateway?

Pushgateway는 특정한 범위에서만 제한적으로 사용하는 게 좋다. 일반적인 메트릭을 수집할 때 평소대로 프로메테우스의 pull 모델을 이용하지 않고 무턱대고 Pushgateway부터 사용하면 몇 가지 함정에 빠지게 된다:

마지막 항목은 여러 job 인스턴스들이 instance 레이블 등을 통해 Pushgateway에 푸시하는 메트릭을 구별할 때와 특히 관련 있다. 이런 상황에선 인스턴스의 이름이 바뀌거나 제거되더라도 Pushgateway엔 해당 인스턴스의 메트릭이 그대로 남아 있게 된다. Pushgateway는 메트릭 캐시로서, 수명 주기가 메트릭을 푸시하는 프로세스들의 수명 주기와는 근본적으로 다르기 때문이다. 프로메테우스의 일반적인 pull 스타일 모니터링과 대비되는 특징이다. 프로메테우스에선 인스턴스가 사라지면 (의도했든 안했든) 관련 메트릭도 자동으로 함께 사라진다. Pushgateway를 사용할 때는 자동으로 사라지지 않으며, 오래된stale 메트릭을 수동으로 삭제하거나 직접 수명 주기 동기화를 자동화해야 한다.

일반적으로 Pushgateway를 사용하는 게 적합한 유일한 유스 케이스는 서비스 수준의 배치 job 결과를 정확하게 가져오는 거다. “서비스 수준” 배치 job이 의미하는 바는 특정 시스템이나 job 인스턴스와는 관계가 없다는 뜻이다 (ex. 서비스 전체에서 여러 사용자들을 삭제하는 배치 job). 이런 job의 메트릭에는 특정 시스템이나 인스턴스의 수명 주기에 따라 나뉘는 시스템, 인스턴스 레이블을 포함해선 안 된다. 이렇게 하면 Pushgateway에서 정체된stale 메트릭을 관리해야 하는 부담을 줄일 수 있다. 배치 job 작업 모니터링을 위한 베스트 프랙티스도 함께 읽어봐라.


Alternative strategies

인바운드 방화벽이나 NAT때문에 타겟에서 메트릭을 가져올 수 없다면, 프로메테우스 서버도 네트워크 장벽 뒤로 이동하는 게 좋다. 일반적으로 권장하는 것도 모니터링하는 인스턴스와 동일한 네트워크에서 프로메테우스 서버를 실행하는 거다. 아니면 프로메테우스가 방화벽이나 NAT 뒤에 있는 지표를 스크랩할 수 있도록 도와주는 PushProx를 검토해봐라.

시스템과 관련있는 배치 job들은 (자동 보안 업데이트 cronjob이나 설정 관리 클라이언트를 실행하는 등) Pushgateway 대신 노드 익스포터textfile collector를 이용해 만들어지는 메트릭들을 노출해라.


Next :
Remote write tuning
remote write 튜닝 가이드

전체 목차는 여기에 있습니다.

<< >>

TOP