url 테이블 함수
url 함수는 지정된 format 및 structure를 사용하여 URL로부터 테이블을 생성합니다.
url 함수는 URL 테이블의 데이터에 대한 SELECT 및 INSERT 쿼리에서 사용할 수 있습니다.
구문
매개변수
| Parameter | Description |
|---|---|
URL | GET 또는 POST 요청을 수신할 수 있는, 작은따옴표로 감싼 HTTP 또는 HTTPS 서버 주소입니다 (SELECT 또는 INSERT 쿼리에 각각 해당). 형식: String. |
format | 데이터의 형식입니다. 형식: String. |
structure | 'UserID UInt64, Name String' 형식의 테이블 구조입니다. 컬럼 이름과 타입을 결정합니다. 형식: String. |
headers | 'headers('key1'='value1', 'key2'='value2')' 형식의 헤더입니다. HTTP 호출에 사용할 헤더를 설정할 수 있습니다. |
반환 값
지정한 형식과 구조를 가지며, 정의된 URL의 데이터를 포함하는 테이블입니다.
예시
CSV 포맷으로 응답하는 HTTP 서버에서 String 및 UInt32 타입의 컬럼을 포함하는 테이블의 처음 3개 행을 가져옵니다.
URL에서 가져온 데이터를 테이블에 삽입:
URL의 글롭 패턴
중괄호 { } 안의 패턴은 세그먼트 집합을 생성하거나 장애 조치(failover) 주소를 지정하는 데 사용됩니다. 지원되는 패턴 유형과 예시는 remote 함수 설명을 참조하십시오.
패턴 내부의 문자 | 는 장애 조치 주소를 지정하는 데 사용됩니다. 이 주소들은 패턴에 나열된 순서대로 차례로 사용됩니다. 생성되는 주소 개수는 glob_expansion_max_elements 설정에 의해 제한됩니다.
가상 컬럼
_path—URL의 경로입니다. 타입:LowCardinality(String)._file—URL의 리소스 이름입니다. 타입:LowCardinality(String)._size— 리소스의 크기(바이트 단위)입니다. 타입:Nullable(UInt64). 크기를 알 수 없으면 값은NULL입니다._time— 파일의 마지막 수정 시간입니다. 타입:Nullable(DateTime). 시간을 알 수 없으면 값은NULL입니다._headers— HTTP 응답 헤더입니다. 타입:Map(LowCardinality(String), LowCardinality(String)).
use_hive_partitioning 설정
use_hive_partitioning을 1로 설정하면 ClickHouse는 경로(/name=value/)에서 Hive 스타일 파티션을 감지하고, 쿼리에서 파티션 컬럼을 가상 컬럼으로 사용할 수 있도록 허용합니다. 이러한 가상 컬럼은 파티션 경로에 있는 이름과 동일하지만 앞에 _가 붙습니다.
예시
Hive 스타일 파티션으로 생성된 가상 컬럼 사용
저장 설정
- engine_url_skip_empty_files - 데이터를 읽을 때 비어 있는 파일을 건너뛸 수 있도록 허용합니다. 기본값은 비활성화입니다.
- enable_url_encoding - URI 경로의 인코딩/디코딩을 활성화하거나 비활성화하도록 허용합니다. 기본값은 활성화입니다.
권한
url 함수에는 CREATE TEMPORARY TABLE 권한이 필요합니다. 따라서 readonly = 1로 설정된 사용자에게는 동작하지 않습니다. 최소한 readonly 설정 값이 2 이상이어야 합니다.