Replicated

이 엔진은 Atomic 엔진을 기반으로 합니다. DDL 로그가 ZooKeeper에 기록되는 방식으로 메타데이터 복제를 지원하며, 해당 데이터베이스의 모든 레플리카에서 실행됩니다.

하나의 ClickHouse 서버에는 여러 개의 복제된 데이터베이스가 동시에 실행되고 업데이트될 수 있습니다. 하지만 하나의 복제된 데이터베이스에 대해 여러 개의 레플리카를 둘 수는 없습니다.

데이터베이스 생성

CREATE DATABASE testdb [UUID '...'] ENGINE = Replicated('zoo_path', 'shard_name', 'replica_name') [SETTINGS ...]

엔진 매개변수

zoo_path — ZooKeeper 경로입니다. 동일한 ZooKeeper 경로는 동일한 데이터베이스에 해당합니다.
shard_name — 세그먼트 이름입니다. 데이터베이스 레플리카는 shard_name별로 세그먼트로 그룹화됩니다.
replica_name — 레플리카 이름입니다. 동일한 세그먼트의 모든 레플리카에 대해 레플리카 이름은 서로 달라야 합니다.

매개변수는 생략할 수 있으며, 이 경우 누락된 매개변수는 기본값으로 대체됩니다.

zoo_path에 매크로 {uuid}가 포함되어 있는 경우, 모든 레플리카가 이 데이터베이스에 대해 동일한 UUID를 사용하도록 보장하기 위해 명시적으로 UUID를 지정하거나 CREATE 문에 ON CLUSTER를 추가해야 합니다.

ReplicatedMergeTree 테이블의 경우 인수를 지정하지 않으면 기본 인수인 /clickhouse/tables/{uuid}/{shard}와 {replica}가 사용됩니다. 이는 서버 설정 default_replica_path 및 default_replica_name에서 변경할 수 있습니다. 매크로 {uuid}는 테이블의 UUID로 확장되고, {shard}와 {replica}는 데이터베이스 엔진 인수가 아니라 서버 설정에 지정된 값으로 확장됩니다. 향후에는 Replicated 데이터베이스의 shard_name과 replica_name을 사용할 수 있게 될 것입니다.

세부 사항 및 권장 사항

Replicated 데이터베이스와 함께 사용하는 DDL 쿼리는 ON CLUSTER 쿼리와 유사하게 동작하지만, 몇 가지 작은 차이점이 있습니다.

먼저, DDL 요청은 이니시에이터(사용자로부터 요청을 처음 받은 호스트)에서 실행을 시도합니다. 요청이 이니시에이터에서 수행되지 못하면 사용자는 즉시 오류를 받으며, 다른 호스트는 이를 처리하려고 시도하지 않습니다. 요청이 이니시에이터에서 성공적으로 완료되면 다른 모든 호스트가 이를 완료할 때까지 자동으로 재시도합니다. 이니시에이터는 다른 호스트에서 쿼리가 완료되기를 (distributed_ddl_task_timeout보다 오래 기다리지 않는 범위에서) 최대한 기다린 후, 각 호스트에서의 쿼리 실행 상태가 포함된 테이블을 반환합니다.

오류 발생 시 동작은 distributed_ddl_output_mode 설정에 의해 제어되며, Replicated 데이터베이스의 경우 이를 null_status_on_timeout으로 설정하는 것이 좋습니다. 즉, 일부 호스트가 distributed_ddl_task_timeout 내에 요청을 실행하지 못한 경우 예외를 던지지 않고, 해당 호스트에 대해 테이블에 NULL 상태를 표시합니다.

system.clusters 시스템 테이블에는 복제된 데이터베이스와 같은 이름의 클러스터가 포함되어 있으며, 이 클러스터는 데이터베이스의 모든 레플리카로 구성됩니다. 이 클러스터는 레플리카 생성/삭제 시 자동으로 갱신되며, Distributed 테이블에 사용할 수 있습니다.

데이터베이스의 새 레플리카를 생성할 때, 이 레플리카는 스스로 테이블을 생성합니다. 레플리카가 오랜 기간 동안 사용 불가능한 상태였고 복제 로그에서 뒤처진 경우, 로컬 메타데이터를 ZooKeeper의 현재 메타데이터와 비교하여 확인하고, 데이터를 포함한 여분의 테이블을 별도의 비복제 데이터베이스로 이동하여(불필요한 데이터를 실수로 삭제하지 않도록) 누락된 테이블을 생성하고, 테이블 이름이 변경되었으면 해당 테이블 이름을 갱신합니다. 데이터는 ReplicatedMergeTree 레벨에서 복제되므로, 테이블이 복제 테이블 엔진을 사용하지 않으면 데이터는 복제되지 않습니다(데이터베이스는 메타데이터에 대해서만 책임을 집니다).

테이블 복제를 유지하지 않고 클러스터만 구성하면 되는 경우, Cluster Discovery 기능을 참고하십시오.

사용 예시

3개의 호스트로 구성된 클러스터를 생성합니다:

node1 :) CREATE DATABASE r ENGINE=Replicated('some/path/r','shard1','replica1');
node2 :) CREATE DATABASE r ENGINE=Replicated('some/path/r','shard1','other_replica');
node3 :) CREATE DATABASE r ENGINE=Replicated('some/path/r','other_shard','{replica}');

암시적 매개변수로 클러스터에서 데이터베이스 생성:

CREATE DATABASE r ON CLUSTER default ENGINE=Replicated;

DDL 쿼리 실행:

CREATE TABLE r.rmt (n UInt64) ENGINE=ReplicatedMergeTree ORDER BY n;

┌─────hosts────────────┬──status─┬─error─┬─num_hosts_remaining─┬─num_hosts_active─┐
│ shard1|replica1      │    0    │       │          2          │        0         │
│ shard1|other_replica │    0    │       │          1          │        0         │
│ other_shard|r1       │    0    │       │          0          │        0         │
└──────────────────────┴─────────┴───────┴─────────────────────┴──────────────────┘

시스템 테이블 보기:

SELECT cluster, shard_num, replica_num, host_name, host_address, port, is_local
FROM system.clusters WHERE cluster='r';

┌─cluster─┬─shard_num─┬─replica_num─┬─host_name─┬─host_address─┬─port─┬─is_local─┐
│ r       │     1     │      1      │   node3   │  127.0.0.1   │ 9002 │     0    │
│ r       │     2     │      1      │   node2   │  127.0.0.1   │ 9001 │     0    │
│ r       │     2     │      2      │   node1   │  127.0.0.1   │ 9000 │     1    │
└─────────┴───────────┴─────────────┴───────────┴──────────────┴──────┴──────────┘

분산 테이블을 생성한 후 데이터를 삽입합니다:

node2 :) CREATE TABLE r.d (n UInt64) ENGINE=Distributed('r','r','rmt', n % 2);
node3 :) INSERT INTO r.d SELECT * FROM numbers(10);
node1 :) SELECT materialize(hostName()) AS host, groupArray(n) FROM r.d GROUP BY host;

┌─hosts─┬─groupArray(n)─┐
│ node3 │  [1,3,5,7,9]  │
│ node2 │  [0,2,4,6,8]  │
└───────┴───────────────┘

다른 호스트에 레플리카 추가:

node4 :) CREATE DATABASE r ENGINE=Replicated('some/path/r','other_shard','r2');

zoo_path에서 매크로 {uuid}를 사용하는 경우, 다른 호스트에 레플리카를 하나 더 추가하기:

node1 :) SELECT uuid FROM system.databases WHERE database='r';
node4 :) CREATE DATABASE r UUID '<uuid from previous query>' ENGINE=Replicated('some/path/{uuid}','other_shard','r2');

클러스터 구성은 다음과 같습니다.

┌─cluster─┬─shard_num─┬─replica_num─┬─host_name─┬─host_address─┬─port─┬─is_local─┐
│ r       │     1     │      1      │   node3   │  127.0.0.1   │ 9002 │     0    │
│ r       │     1     │      2      │   node4   │  127.0.0.1   │ 9003 │     0    │
│ r       │     2     │      1      │   node2   │  127.0.0.1   │ 9001 │     0    │
│ r       │     2     │      2      │   node1   │  127.0.0.1   │ 9000 │     1    │
└─────────┴───────────┴─────────────┴───────────┴──────────────┴──────┴──────────┘

분산 테이블도 새 호스트로부터 데이터를 받게 됩니다:

node2 :) SELECT materialize(hostName()) AS host, groupArray(n) FROM r.d GROUP BY host;

┌─hosts─┬─groupArray(n)─┐
│ node2 │  [1,3,5,7,9]  │
│ node4 │  [0,2,4,6,8]  │
└───────┴───────────────┘

설정

다음 설정을 사용할 수 있습니다:

Setting	기본값	설명
`max_broken_tables_ratio`	1	오래된 테이블 수와 전체 테이블 수의 비율이 이 값보다 큰 경우, 레플리카를 자동으로 복구하지 않습니다
`max_replication_lag_to_enqueue`	50	레플리카의 복제 지연이 이 값보다 큰 경우, 쿼리를 실행하려 할 때 예외를 발생시킵니다
`wait_entry_commited_timeout_sec`	3600	타임아웃을 초과했지만 이니시에이터 호스트가 아직 쿼리를 실행하지 않은 경우, 레플리카는 쿼리 취소를 시도합니다
`collection_name`		클러스터 인증에 대한 모든 정보가 정의된 서버 설정(config)의 컬렉션 이름입니다
`check_consistency`	true	로컬 메타데이터와 Keeper의 메타데이터 일관성을 검사하며, 불일치가 있으면 레플리카를 복구합니다
`max_retries_before_automatic_recovery`	10	레플리카를 손실된 것으로 표시하고 스냅샷에서 복구하기 전에 큐 엔트리 실행을 시도하는 최대 횟수입니다(0은 무한대를 의미합니다)
`allow_skipping_old_temporary_tables_ddls_of_refreshable_materialized_views`	false	활성화된 경우, Replicated 데이터베이스에서 DDL을 처리할 때 가능하다면 갱신 가능 구체화 뷰의 임시 테이블에 대한 DDL 생성 및 교환을 건너뜁니다
`logs_to_keep`	1000	Replicated 데이터베이스에 대해 ZooKeeper에 보존할 로그의 기본 개수입니다.
`default_replica_path`	`/clickhouse/databases/{uuid}`	ZooKeeper 내 데이터베이스의 경로입니다. 데이터베이스 생성 시 인수가 생략되면 이 값이 사용됩니다.
`default_replica_shard_name`	`{shard}`	데이터베이스에서 레플리카의 세그먼트 이름입니다. 데이터베이스 생성 시 인수가 생략되면 이 값이 사용됩니다.
`default_replica_name`	`{replica}`	데이터베이스에서 레플리카의 이름입니다. 데이터베이스 생성 시 인수가 생략되면 이 값이 사용됩니다.

기본값은 구성 파일에서 변경할 수 있습니다

<clickhouse>
    <database_replicated>
        <max_broken_tables_ratio>0.75</max_broken_tables_ratio>
        <max_replication_lag_to_enqueue>100</max_replication_lag_to_enqueue>
        <wait_entry_commited_timeout_sec>1800</wait_entry_commited_timeout_sec>
        <collection_name>postgres1</collection_name>
        <check_consistency>false</check_consistency>
        <max_retries_before_automatic_recovery>5</max_retries_before_automatic_recovery>
        <default_replica_path>/clickhouse/databases/{uuid}</default_replica_path>
        <default_replica_shard_name>{shard}</default_replica_shard_name>
        <default_replica_name>{replica}</default_replica_name>
    </database_replicated>
</clickhouse>

데이터베이스 생성​

세부 사항 및 권장 사항​

사용 예시​

설정​

데이터베이스 생성

세부 사항 및 권장 사항

사용 예시

설정