본문으로 바로가기
본문으로 바로가기

uniqTheta

uniqTheta

도입 버전: v21.6

Theta Sketch Framework을 사용하여 서로 다른 인자 값의 개수를 근사적으로 계산합니다.

구현 세부 사항

이 FUNCTION은 집계에 포함된 모든 매개변수에 대해 해시를 계산한 다음, 이 값을 사용하여 계산을 수행합니다. 서로 다른 인자 값의 개수를 근사하기 위해 KMV 알고리즘을 사용합니다.

4096(2^12)개의 64비트 스케치를 사용합니다. 상태 크기는 약 41 KB입니다.

상대 오차는 3.125%(95% 신뢰도)입니다. 자세한 내용은 상대 오차 표를 참고하십시오.

구문

uniqTheta(x[, ...])

인수

반환 값

서로 다른 인수 값의 개수를 근사하여 나타내는 UInt64 타입 숫자를 반환합니다. UInt64

예시

기본 사용법

CREATE TABLE example_theta
(
    id UInt32,
    category String
)
ENGINE = Memory;

INSERT INTO example_theta VALUES
(1, 'A'), (2, 'B'), (3, 'A'), (4, 'C'), (5, 'B'), (6, 'A');

SELECT uniqTheta(category) as theta_unique_categories
FROM example_theta;
┌─theta_unique_categories─┐
│                       3 │
└─────────────────────────┘

참고 항목