모니터링

참고

이 가이드에서 설명하는 모니터링 데이터는 ClickHouse Cloud에서 확인할 수 있습니다. 아래에 설명된 기본 제공 대시보드에 표시될 뿐만 아니라, 기본 및 고급 성능 지표를 모두 메인 서비스 콘솔에서 직접 조회할 수도 있습니다.

다음을 모니터링할 수 있습니다:

하드웨어 리소스 사용률
ClickHouse 서버 메트릭

기본 제공 고급 관측성 대시보드

ClickHouse에는 기본 제공되는 고급 관측성 대시보드가 있으며, $HOST:$PORT/dashboard(사용자 이름과 비밀번호 필요)를 통해 액세스할 수 있습니다. 이 대시보드는 다음과 같은 메트릭을 보여 줍니다:

초당 쿼리 수
CPU 사용량(코어)
실행 중인 쿼리 수
실행 중인 머지 작업 수
초당 선택된 바이트 수
I/O 대기 시간
CPU 대기 시간
OS CPU 사용률(사용자 공간)
OS CPU 사용률(커널 공간)
디스크 읽기
파일 시스템 읽기
메모리(추적)
초당 삽입된 행 수
전체 MergeTree 파트 수
파티션당 최대 파트 수

리소스 사용률

ClickHouse는 다음과 같은 하드웨어 리소스의 상태도 자체적으로 모니터링합니다:

프로세서의 부하 및 온도
스토리지 시스템, RAM 및 네트워크의 사용률

이 데이터는 system.asynchronous_metric_log 테이블에 수집됩니다.

ClickHouse server metrics

ClickHouse 서버에는 자체 상태 모니터링을 위한 도구가 내장되어 있습니다.

서버 이벤트를 추적하려면 서버 로그를 사용하십시오. 설정 파일의 logger 섹션을 참조하십시오.

ClickHouse는 다음을 수집합니다:

서버가 연산 자원(컴퓨팅 리소스)을 어떻게 사용하는지에 대한 다양한 메트릭.
쿼리 처리에 대한 일반적인 통계.

메트릭은 system.metrics, system.events, system.asynchronous_metrics 테이블에서 확인할 수 있습니다.

ClickHouse가 메트릭을 Graphite로 내보내도록 설정할 수 있습니다. ClickHouse 서버 설정 파일의 Graphite 섹션을 참조하십시오. 메트릭 내보내기를 설정하기 전에 공식 가이드를 따라 먼저 Graphite를 설정해야 합니다.

ClickHouse가 메트릭을 Prometheus로 내보내도록 설정할 수 있습니다. ClickHouse 서버 설정 파일의 Prometheus 섹션을 참조하십시오. 메트릭 내보내기를 설정하기 전에 공식 가이드를 따라 먼저 Prometheus를 설정해야 합니다.

또한 HTTP API를 통해 서버 가용성을 모니터링할 수 있습니다. HTTP GET 요청을 /ping으로 전송하십시오. 서버가 정상적으로 동작 중이면 200 OK로 응답합니다.

클러스터 구성에서 서버를 모니터링하려면 max_replica_delay_for_distributed_queries 파라미터를 설정하고 HTTP 리소스 /replicas_status를 사용해야 합니다. /replicas_status에 대한 요청은 레플리카가 사용 가능하며 다른 레플리카보다 지연되지 않은 경우 200 OK를 반환합니다. 레플리카가 지연된 경우, 지연 시간에 대한 정보와 함께 503 HTTP_SERVICE_UNAVAILABLE을 반환합니다.

기본 제공 고급 관측성 대시보드​

리소스 사용률​

ClickHouse server metrics​

기본 제공 고급 관측성 대시보드

리소스 사용률

ClickHouse server metrics