본문으로 바로가기
본문으로 바로가기

deltaLakeCluster 테이블 함수

이 함수는 deltaLake 테이블 함수의 확장입니다.

지정된 클러스터의 여러 노드에서 Amazon S3에 있는 Delta Lake 테이블의 파일을 병렬로 처리할 수 있습니다. 이니시에이터 노드는 클러스터의 모든 노드와 연결을 맺고 각 파일을 동적으로 분배합니다. 워커 노드는 처리할 다음 작업을 이니시에이터 노드에 요청한 뒤 해당 작업을 처리합니다. 모든 작업이 완료될 때까지 이 과정이 반복됩니다.

구문

deltaLakeCluster(cluster_name, url [,aws_access_key_id, aws_secret_access_key] [,format] [,structure] [,compression])
deltaLakeCluster(cluster_name, named_collection[, option=value [,..]])

deltaLakeS3Cluster(cluster_name, url [,aws_access_key_id, aws_secret_access_key] [,format] [,structure] [,compression])
deltaLakeS3Cluster(cluster_name, named_collection[, option=value [,..]])

deltaLakeAzureCluster(cluster_name, connection_string|storage_account_url, container_name, blobpath, [,account_name], [,account_key] [,format] [,compression_method])
deltaLakeAzureCluster(cluster_name, named_collection[, option=value [,..]])

deltaLakeS3ClusterdeltaLakeCluster의 별칭으로, 둘 다 S3용입니다.

인수

  • cluster_name — 원격 및 로컬 서버에 대한 주소와 연결 파라미터 집합을 구성하는 데 사용되는 클러스터 이름입니다.

  • 나머지 모든 인수에 대한 설명은 동일한 deltaLake 테이블 함수의 인수 설명과 동일합니다.

반환 값

S3에 있는 지정된 Delta Lake 테이블에서 클러스터의 데이터를 읽기 위해, 지정된 구조로 생성되는 테이블입니다.

가상 컬럼

  • _path — 파일 경로입니다. 타입: LowCardinality(String).
  • _file — 파일 이름입니다. 타입: LowCardinality(String).
  • _size — 파일 크기(바이트 단위)입니다. 타입: Nullable(UInt64). 파일 크기를 알 수 없는 경우 값은 NULL입니다.
  • _time — 파일의 마지막 수정 시간입니다. 타입: Nullable(DateTime). 시간을 알 수 없는 경우 값은 NULL입니다.
  • _etag — 파일의 ETag입니다. 타입: LowCardinality(String). ETag를 알 수 없는 경우 값은 NULL입니다.