approx_top_k
approx_top_k
도입 버전: v1.1
지정된 컬럼에서 근사적으로 가장 자주 나타나는 값들과 그 개수를 배열로 반환합니다. 결과 배열은 값 자체가 아니라 값의 근사적 출현 빈도를 기준으로 내림차순 정렬됩니다.
이 함수는 결과를 보장하지 않습니다. 특정 상황에서는 오류가 발생할 수 있으며, 실제로 가장 자주 나타나는 값이 아님에도 빈번한 값으로 반환되는 값이 포함될 수 있습니다.
구문
별칭: approx_top_count
매개변수
N— 반환할 요소의 개수입니다. 기본값:10.N의 최댓값:65536.UInt64reserved— 옵션입니다. 값을 위해 얼마나 많은 셀을 예약할지 정의합니다.uniq(column) > reserved이면 결과는 근사값이 됩니다. 기본값:N * 3.UInt64
인수
column— 가장 자주 등장하는 값을 찾을 컬럼 이름입니다.String
반환 값
근사적으로 가장 자주 등장하는 값과 그 개수를, 근사 빈도 기준 내림차순으로 정렬한 배열을 반환합니다. Array
예시
사용 예시
함께 보기