iceberg Table Function

Amazon S3, Azure, HDFS 또는 로컬에 저장된 Apache Iceberg 테이블에 대해 읽기 전용 테이블형 인터페이스를 제공합니다.

구문

icebergS3(url [, NOSIGN | access_key_id, secret_access_key, [session_token]] [,format] [,compression_method])
icebergS3(named_collection[, option=value [,..]])

icebergAzure(connection_string|storage_account_url, container_name, blobpath, [,account_name], [,account_key] [,format] [,compression_method])
icebergAzure(named_collection[, option=value [,..]])

icebergHDFS(path_to_table, [,format] [,compression_method])
icebergHDFS(named_collection[, option=value [,..]])

icebergLocal(path_to_table, [,format] [,compression_method])
icebergLocal(named_collection[, option=value [,..]])

Arguments

인수에 대한 설명은 각각 s3, azureBlobStorage, HDFS, file 테이블 함수의 인수 설명과 동일합니다.
format은 Iceberg 테이블에서 데이터 파일의 형식을 나타냅니다.

반환 값

지정된 Iceberg 테이블의 데이터를 읽기 위한 지정된 구조의 테이블입니다.

예제

SELECT * FROM icebergS3('http://test.s3.amazonaws.com/clickhouse-bucket/test_table', 'test', 'test')

참조

ClickHouse는 현재 icebergS3, icebergAzure, icebergHDFS, icebergLocal 테이블 함수와 IcebergS3, icebergAzure, IcebergHDFS, IcebergLocal 테이블 엔진을 통해 Iceberg 포맷 v1 및 v2 데이터를 읽는 것을 지원합니다.

명명된 컬렉션 정의

URL과 자격 증명을 저장할 명명된 컬렉션을 구성하는 예시는 다음과 같습니다:

<clickhouse>
    <named_collections>
        <iceberg_conf>
            <url>http://test.s3.amazonaws.com/clickhouse-bucket/</url>
            <access_key_id>test<access_key_id>
            <secret_access_key>test</secret_access_key>
            <format>auto</format>
            <structure>auto</structure>
        </iceberg_conf>
    </named_collections>
</clickhouse>

SELECT * FROM icebergS3(iceberg_conf, filename = 'test_table')
DESCRIBE icebergS3(iceberg_conf, filename = 'test_table')

데이터 카탈로그 사용

Iceberg 테이블은 REST Catalog, AWS Glue Data Catalog, Unity Catalog 등 다양한 데이터 카탈로그와 함께 사용할 수 있습니다.

참조

카탈로그를 사용하는 경우 대부분의 사용자는 DataLakeCatalog 데이터베이스 엔진을 사용하여 카탈로그에 ClickHouse를 연결하고, 카탈로그에 등록된 테이블을 자동으로 탐색하도록 설정합니다. 이 데이터베이스 엔진을 사용하면 IcebergS3 테이블 엔진으로 개별 테이블을 일일이 수동 생성하지 않고도 테이블을 사용할 수 있습니다.

데이터 카탈로그를 사용하려면 IcebergS3 엔진으로 테이블을 생성하고 필요한 설정을 지정합니다.

예를 들어, MinIO 스토리지와 REST Catalog를 함께 사용하는 경우:

CREATE TABLE `database_name.table_name`
ENGINE = IcebergS3(
  'http://minio:9000/warehouse-rest/table_name/',
  'minio_access_key',
  'minio_secret_key'
)
SETTINGS 
  storage_catalog_type="rest",
  storage_warehouse="demo",
  object_storage_endpoint="http://minio:9000/warehouse-rest",
  storage_region="us-east-1",
  storage_catalog_url="http://rest:8181/v1"

또는 S3와 함께 AWS Glue Data Catalog를 사용하는 경우:

CREATE TABLE `my_database.my_table`  
ENGINE = IcebergS3(
  's3://my-data-bucket/warehouse/my_database/my_table/',
  'aws_access_key',
  'aws_secret_key'
)
SETTINGS 
  storage_catalog_type = 'glue',
  storage_warehouse = 'my_database',
  object_storage_endpoint = 's3://my-data-bucket/',
  storage_region = 'us-east-1',
  storage_catalog_url = 'https://glue.us-east-1.amazonaws.com/iceberg/v1'

스키마 변경(Schema Evolution)

현재 CH를 사용하여 시간이 지나면서 스키마가 변경된 iceberg 테이블을 읽을 수 있습니다. 컬럼이 추가되거나 제거되고 순서가 변경된 테이블을 읽는 것을 지원합니다. 값이 필수인 컬럼을 NULL을 허용하는 컬럼으로 변경하는 것도 가능합니다. 추가로, 단순 타입에 대해 허용되는 타입 캐스팅을 다음과 같이 지원합니다:

int -> long
float -> double
decimal(P, S) -> decimal(P', S) where P' > P.

현재는 중첩 구조나 배열 및 맵 내부 요소의 타입을 변경하는 것은 불가능합니다.

파티션 프루닝

ClickHouse는 SELECT 쿼리에서 Iceberg 테이블에 대한 파티션 프루닝을 지원하여 관련 없는 데이터 파일을 건너뛰고 쿼리 성능을 최적화합니다. 파티션 프루닝을 활성화하려면 use_iceberg_partition_pruning = 1로 설정합니다. Iceberg 파티션 프루닝에 대한 자세한 내용은 https://iceberg.apache.org/spec/#partitioning을 참조하십시오.

타임 트래블

ClickHouse는 Iceberg 테이블에 대해 타임 트래블을 지원하여 특정 타임스탬프나 스냅샷 ID를 기준으로 과거 시점의 데이터를 쿼리할 수 있도록 합니다.

삭제된 행이 포함된 테이블 처리

현재는 position deletes를 사용하는 Iceberg 테이블만 지원합니다.

다음과 같은 삭제 방식은 지원되지 않습니다:

Equality deletes
Deletion vectors (v3에서 도입됨)

기본 사용법

 SELECT * FROM example_table ORDER BY 1 
 SETTINGS iceberg_timestamp_ms = 1714636800000

 SELECT * FROM example_table ORDER BY 1 
 SETTINGS iceberg_snapshot_id = 3547395809148285433

참고: 하나의 쿼리에서 iceberg_timestamp_ms와 iceberg_snapshot_id 파라미터를 동시에 지정할 수 없습니다.

중요한 고려 사항

**스냅샷(Snapshot)**은 일반적으로 다음과 같은 경우에 생성됩니다:
테이블에 새 데이터가 기록될 때
어떤 형태로든 데이터 압축(compaction)이 수행될 때
스키마 변경으로는 일반적으로 스냅샷이 생성되지 않습니다 - 이는 스키마 변경이 발생한 테이블에서 시간 이동(time travel)을 사용할 때 중요한 동작상의 특성을 가져옵니다.

예시 시나리오

모든 시나리오는 ClickHouse가 아직 Iceberg 테이블에 쓰기를 지원하지 않기 때문에 Spark로 작성되어 있습니다.

시나리오 1: 새 스냅샷 없이 스키마 변경

다음과 같은 작업 순서를 가정합니다:

 -- Create a table with two columns
  CREATE TABLE IF NOT EXISTS spark_catalog.db.time_travel_example (
  order_number bigint, 
  product_code string
  ) 
  USING iceberg 
  OPTIONS ('format-version'='2')

- - Insert data into the table
  INSERT INTO spark_catalog.db.time_travel_example VALUES 
    (1, 'Mars')

  ts1 = now() // A piece of pseudo code

- - Alter table to add a new column
  ALTER TABLE spark_catalog.db.time_travel_example ADD COLUMN (price double)
 
  ts2 = now()

- - Insert data into the table
  INSERT INTO spark_catalog.db.time_travel_example VALUES (2, 'Venus', 100)

   ts3 = now()

- - Query the table at each timestamp
  SELECT * FROM spark_catalog.db.time_travel_example TIMESTAMP AS OF ts1;

+------------+------------+
|order_number|product_code|
+------------+------------+
|           1|        Mars|
+------------+------------+
  SELECT * FROM spark_catalog.db.time_travel_example TIMESTAMP AS OF ts2;

+------------+------------+
|order_number|product_code|
+------------+------------+
|           1|        Mars|
+------------+------------+

  SELECT * FROM spark_catalog.db.time_travel_example TIMESTAMP AS OF ts3;

+------------+------------+-----+
|order_number|product_code|price|
+------------+------------+-----+
|           1|        Mars| NULL|
|           2|       Venus|100.0|
+------------+------------+-----+

서로 다른 타임스탬프에서의 쿼리 결과:

ts1 및 ts2 시점: 원래의 두 개 컬럼만 표시됩니다
ts3 시점: 세 개 컬럼이 모두 표시되며, 첫 번째 행의 price 값은 NULL입니다

시나리오 2: 과거 스키마와 현재 스키마 차이

현재 시점에 실행하는 타임 트래블 쿼리는 현재 테이블과는 다른 스키마를 보여줄 수 있습니다:

-- Create a table
  CREATE TABLE IF NOT EXISTS spark_catalog.db.time_travel_example_2 (
  order_number bigint, 
  product_code string
  ) 
  USING iceberg 
  OPTIONS ('format-version'='2')

-- Insert initial data into the table
  INSERT INTO spark_catalog.db.time_travel_example_2 VALUES (2, 'Venus');

-- Alter table to add a new column
  ALTER TABLE spark_catalog.db.time_travel_example_2 ADD COLUMN (price double);

  ts = now();

-- Query the table at a current moment but using timestamp syntax

  SELECT * FROM spark_catalog.db.time_travel_example_2 TIMESTAMP AS OF ts;

    +------------+------------+
    |order_number|product_code|
    +------------+------------+
    |           2|       Venus|
    +------------+------------+

-- Query the table at a current moment
  SELECT * FROM spark_catalog.db.time_travel_example_2;
    +------------+------------+-----+
    |order_number|product_code|price|
    +------------+------------+-----+
    |           2|       Venus| NULL|
    +------------+------------+-----+

이러한 현상은 ALTER TABLE이 새로운 스냅샷을 생성하지 않고, 현재 테이블에 대해서는 Spark가 스냅샷이 아니라 최신 메타데이터 파일에서 schema_id 값을 읽어오기 때문입니다.

시나리오 3: 과거 스키마와 현재 스키마 간 차이

둘째, time travel을 수행하더라도 테이블에 어떤 데이터도 기록되기 전 시점의 상태는 조회할 수 없습니다:

-- Create a table
  CREATE TABLE IF NOT EXISTS spark_catalog.db.time_travel_example_3 (
  order_number bigint, 
  product_code string
  ) 
  USING iceberg 
  OPTIONS ('format-version'='2');

  ts = now();

-- Query the table at a specific timestamp
  SELECT * FROM spark_catalog.db.time_travel_example_3 TIMESTAMP AS OF ts; -- Finises with error: Cannot find a snapshot older than ts.

ClickHouse의 동작은 Spark와 동일합니다. Spark SELECT 쿼리를 ClickHouse SELECT 쿼리로 생각해도 동일하게 동작합니다.

Metadata File Resolution

ClickHouse에서 iceberg table function을 사용할 때, 시스템은 Iceberg 테이블 구조를 정의하는 적절한 metadata.json 파일을 찾아야 합니다. 이 메타데이터 파일을 찾는 절차는 다음과 같습니다.

후보 검색(우선순위 기준)

직접 경로 지정: *iceberg_metadata_file_path을(를) 설정하면, 시스템은 이 값을 Iceberg 테이블 디렉터리 경로와 결합하여 해당 경로 그대로 사용합니다.

이 설정이 지정된 경우, 다른 모든 메타데이터 해석(결정) 관련 설정은 무시됩니다.

테이블 UUID 일치: *iceberg_metadata_table_uuid가 지정된 경우, 시스템은 다음을 수행합니다:
- metadata 디렉터리의 .metadata.json 파일만 확인합니다
- 지정한 UUID와 일치하는 table-uuid 필드를 포함하는 파일만 필터링합니다(대소문자 구분 없음)
기본 검색: *위의 두 설정이 모두 지정되지 않은 경우, metadata 디렉터리의 모든 .metadata.json 파일이 후보가 됩니다

가장 최근 파일 선택

위 규칙을 사용해 후보 파일을 식별한 후, 시스템은 다음 기준으로 어떤 파일이 가장 최근인지 결정합니다:

iceberg_recent_metadata_file_by_last_updated_ms_field가 활성화된 경우:
last-updated-ms 값이 가장 큰 파일이 선택됩니다
그렇지 않은 경우:
버전 번호가 가장 높은 파일이 선택됩니다
(버전은 V.metadata.json 또는 V-uuid.metadata.json 형식의 파일 이름에서 V로 표시됩니다)

참고: 언급된 모든 설정은 테이블 함수 설정(전역 설정이나 쿼리 수준 설정이 아님)이며, 아래와 같이 지정해야 합니다:

SELECT * FROM iceberg('s3://bucket/path/to/iceberg_table', 
    SETTINGS iceberg_metadata_table_uuid = 'a90eed4c-f74b-4e5b-b630-096fb9d09021');

참고: 일반적으로 Iceberg Catalog는 메타데이터 해석을 처리하지만, ClickHouse의 iceberg 테이블 함수는 S3에 저장된 파일을 Iceberg 테이블로 직접 해석합니다. 이런 이유로 이러한 해석 규칙을 이해하는 것이 중요합니다.

메타데이터 캐시

Iceberg 테이블 엔진과 테이블 함수는 매니페스트 파일, 매니페스트 목록, 메타데이터 JSON 정보를 저장하는 메타데이터 캐시를 지원합니다. 메타데이터 캐시는 메모리에 저장됩니다. 이 기능은 기본적으로 활성화되어 있는 use_iceberg_metadata_files_cache 설정으로 제어됩니다.

별칭

테이블 함수 iceberg는 이제 icebergS3의 별칭입니다.

가상 컬럼

_path — 파일 경로입니다. 형식: LowCardinality(String).
_file — 파일 이름입니다. 형식: LowCardinality(String).
_size — 파일 크기(바이트 단위)입니다. 형식: Nullable(UInt64). 파일 크기를 알 수 없는 경우 값은 NULL입니다.
_time — 파일의 마지막 수정 시각입니다. 형식: Nullable(DateTime). 시각을 알 수 없는 경우 값은 NULL입니다.
_etag — 파일의 ETag입니다. 형식: LowCardinality(String). ETag를 알 수 없는 경우 값은 NULL입니다.

iceberg 테이블에 쓰기

버전 25.7부터 ClickHouse에서는 사용자 Iceberg 테이블에 대한 수정 작업을 지원합니다.

현재 이 기능은 실험적 기능이므로, 먼저 다음과 같이 활성화해야 합니다:

SET allow_insert_into_iceberg = 1;

테이블 생성

비어 있는 Iceberg 테이블을 생성하려면 읽기와 동일한 명령을 사용하되 스키마를 명시적으로 지정하면 됩니다. 쓰기 작업은 Iceberg 사양에서 정의된 모든 데이터 포맷(Parquet, Avro, ORC 등)을 지원합니다.

예제

CREATE TABLE iceberg_writes_example
(
    x Nullable(String),
    y Nullable(Int32)
)
ENGINE = IcebergLocal('/home/scanhex12/iceberg_example/')

참고: 버전 힌트 파일을 생성하려면 iceberg_use_version_hint 설정을 활성화하십시오. metadata.json 파일을 압축하려면 iceberg_metadata_compression_method 설정에서 코덱 이름을 지정하십시오.

INSERT

새 테이블을 생성한 후, 일반적인 ClickHouse 구문을 사용해 데이터를 삽입할 수 있습니다.

예제

INSERT INTO iceberg_writes_example VALUES ('Pavel', 777), ('Ivanov', 993);

SELECT *
FROM iceberg_writes_example
FORMAT VERTICAL;

Row 1:
──────
x: Pavel
y: 777

Row 2:
──────
x: Ivanov
y: 993

DELETE

merge-on-read 형식에서 불필요한 행 삭제도 ClickHouse에서 지원합니다. 이 쿼리는 position delete 파일이 포함된 새로운 스냅샷을 생성합니다.

NOTE: 향후 다른 Iceberg 엔진(Spark 등)으로 테이블을 읽으려면 output_format_parquet_use_custom_encoder 및 output_format_parquet_parallel_encoding 설정을 비활성화해야 합니다. 이는 Spark가 이러한 파일을 Parquet 필드 ID(field-id)를 기준으로 읽는 반면, ClickHouse는 해당 플래그가 활성화된 경우 현재 필드 ID 쓰기를 지원하지 않기 때문입니다. 향후 이 동작은 수정될 예정입니다.

예제

ALTER TABLE iceberg_writes_example DELETE WHERE x != 'Ivanov';

SELECT *
FROM iceberg_writes_example
FORMAT VERTICAL;

Row 1:
──────
x: Ivanov
y: 993

스키마 변경

ClickHouse에서는 단순 타입(튜플, 배열, 맵이 아닌 타입)을 사용하는 컬럼을 추가, 삭제 또는 수정할 수 있습니다.

예제

ALTER TABLE iceberg_writes_example MODIFY COLUMN y Nullable(Int64);
SHOW CREATE TABLE iceberg_writes_example;

   ┌─statement─────────────────────────────────────────────────┐
1. │ CREATE TABLE default.iceberg_writes_example              ↴│
   │↳(                                                        ↴│
   │↳    `x` Nullable(String),                                ↴│
   │↳    `y` Nullable(Int64)                                  ↴│
   │↳)                                                        ↴│
   │↳ENGINE = IcebergLocal('/home/scanhex12/iceberg_example/') │
   └───────────────────────────────────────────────────────────┘

ALTER TABLE iceberg_writes_example ADD COLUMN z Nullable(Int32);
SHOW CREATE TABLE iceberg_writes_example;

   ┌─statement─────────────────────────────────────────────────┐
1. │ CREATE TABLE default.iceberg_writes_example              ↴│
   │↳(                                                        ↴│
   │↳    `x` Nullable(String),                                ↴│
   │↳    `y` Nullable(Int64),                                 ↴│
   │↳    `z` Nullable(Int32)                                  ↴│
   │↳)                                                        ↴│
   │↳ENGINE = IcebergLocal('/home/scanhex12/iceberg_example/') │
   └───────────────────────────────────────────────────────────┘

SELECT *
FROM iceberg_writes_example
FORMAT VERTICAL;

Row 1:
──────
x: Ivanov
y: 993
z: ᴺᵁᴸᴸ

ALTER TABLE iceberg_writes_example DROP COLUMN z;
SHOW CREATE TABLE iceberg_writes_example;
   ┌─statement─────────────────────────────────────────────────┐
1. │ CREATE TABLE default.iceberg_writes_example              ↴│
   │↳(                                                        ↴│
   │↳    `x` Nullable(String),                                ↴│
   │↳    `y` Nullable(Int64)                                  ↴│
   │↳)                                                        ↴│
   │↳ENGINE = IcebergLocal('/home/scanhex12/iceberg_example/') │
   └───────────────────────────────────────────────────────────┘

SELECT *
FROM iceberg_writes_example
FORMAT VERTICAL;

Row 1:
──────
x: Ivanov
y: 993

압축(Compaction)

ClickHouse는 Iceberg 테이블용 컴팩션(compaction)을 지원합니다. 현재는 메타데이터를 업데이트하면서 position delete 파일을 데이터 파일로 병합할 수 있습니다. 이전 스냅샷 ID와 타임스탬프는 변경되지 않으므로, 동일한 값으로 time-travel 기능을 계속 사용할 수 있습니다.

사용 방법:

SET allow_experimental_iceberg_compaction = 1

OPTIMIZE TABLE iceberg_writes_example;

SELECT *
FROM iceberg_writes_example
FORMAT VERTICAL;

Row 1:
──────
x: Ivanov
y: 993

구문​

Arguments​

반환 값​

예제​

명명된 컬렉션 정의​

데이터 카탈로그 사용​

스키마 변경(Schema Evolution)​

파티션 프루닝​

타임 트래블​

삭제된 행이 포함된 테이블 처리​

기본 사용법​

중요한 고려 사항​

예시 시나리오​

시나리오 1: 새 스냅샷 없이 스키마 변경​

시나리오 2: 과거 스키마와 현재 스키마 차이​

시나리오 3: 과거 스키마와 현재 스키마 간 차이​

Metadata File Resolution​

후보 검색(우선순위 기준)​

가장 최근 파일 선택​

메타데이터 캐시​

별칭​

가상 컬럼​

iceberg 테이블에 쓰기​

테이블 생성​

예제​

INSERT​

예제​

DELETE​

예제​

스키마 변경​

예제​

압축(Compaction)​

같이 보기​

구문