QBit 데이터 타입
QBit 데이터 타입은 더 빠른 근사 검색을 위해 벡터 저장 방식을 재구성합니다. 각 벡터의 요소를 함께 저장하는 대신, 모든 벡터에서 동일한 이진수 비트 위치를 기준으로 묶어서 저장합니다.
이 방식은 벡터를 전체 정밀도로 저장하면서, 검색 시점에 세밀한 양자화 수준을 선택할 수 있도록 합니다. 더 적은 비트를 읽으면 I/O가 줄어들어 계산이 더 빨라지고, 더 많은 비트를 읽으면 정확도가 높아집니다. 양자화를 통해 데이터 전송량과 연산량 감소에 따른 속도 이점을 얻으면서도, 필요할 때는 원본 데이터가 그대로 유지된 상태로 언제든지 사용할 수 있습니다.
QBit 타입 컬럼을 선언하려면 다음 구문을 사용합니다:
element_type– 각 벡터 요소의 타입입니다. 사용할 수 있는 타입은BFloat16,Float32,Float64입니다.dimension– 각 벡터에 포함된 요소 개수입니다.
QBit 생성
테이블 컬럼 정의에서 QBit 타입을 사용합니다:
QBit 서브컬럼
QBit은(는) 저장된 벡터의 개별 비트 플레인에 액세스할 수 있는 서브컬럼 액세스 패턴을 구현합니다. 각 비트 위치는 .N 구문을 사용하여 액세스할 수 있으며, 여기서 N은 비트 위치를 의미합니다:
접근할 수 있는 하위 컬럼(subcolumn)의 개수는 요소 유형에 따라 달라집니다:
BFloat16: 하위 컬럼 16개(1-16)Float32: 하위 컬럼 32개(1-32)Float64: 하위 컬럼 64개(1-64)
벡터 검색 함수
다음은 QBit 데이터 타입을 사용하는 벡터 유사도 검색용 거리 함수들입니다: