본문으로 바로가기
본문으로 바로가기

Npy

InputOutputAlias

설명

Npy 포맷은 .npy 파일에 저장된 NumPy 배열을 ClickHouse로 로드하기 위해 설계되었습니다.
NumPy 파일 포맷은 수치 데이터 배열을 효율적으로 저장하기 위해 사용되는 이진 포맷입니다.
가져오는 동안 ClickHouse는 최상위 차원을 단일 컬럼을 가진 행 배열로 처리합니다.

아래 표는 지원되는 Npy 데이터 타입과 ClickHouse에서의 대응 타입을 보여 줍니다:

데이터 타입 매칭

Npy 데이터 타입 (INSERT)ClickHouse 데이터 타입Npy 데이터 타입 (SELECT)
i1Int8i1
i2Int16i2
i4Int32i4
i8Int64i8
u1, b1UInt8u1
u2UInt16u2
u4UInt32u4
u8UInt64u8
f2, f4Float32f4
f8Float64f8
S, UStringS
FixedStringS

사용 예제

Python을 사용하여 배열을 .npy 형식으로 저장하기

import numpy as np
arr = np.array([[[1],[2],[3]],[[4],[5],[6]]])
np.save('example_array.npy', arr)

ClickHouse에서 NumPy 파일을 읽는 방법

SELECT *
FROM file('example_array.npy', Npy)
┌─array─────────┐
│ [[1],[2],[3]] │
│ [[4],[5],[6]] │
└───────────────┘

데이터 선택

다음 clickhouse-client 명령을 사용하면 ClickHouse 테이블에서 데이터를 조회하여 Npy 형식의 파일로 저장할 수 있습니다:

$ clickhouse-client --query="SELECT {column} FROM {some_table} FORMAT Npy" > {filename.npy}

형식 설정