system.unicode
system.unicode 테이블은 Unicode 문자와 그 속성(https://unicode-org.github.io/icu/userguide/strings/properties.html)에 대한 정보를 제공하는 가상 테이블입니다. 이 테이블은 요청 시 실시간으로 생성됩니다.
컬럼
참고
ICU 문서에 있는 Unicode 코드 포인트의 속성 이름은 snake case로 변환됩니다.
code_point(String) — 코드 포인트의 UTF-8 표현입니다.code_point_value(Int32) — 코드 포인트의 숫자 값입니다.notation(String) — 코드 포인트의 Unicode 표기입니다.- Binary Properties (UInt8) - 코드 포인트의 이진 속성입니다.
alphabetic,ascii_hex_digit,case_ignorable...
- Enumerated Properties (Int32) - 코드 포인트의 열거형 속성입니다.
bidi_class,bidi_paired_bracket_type,block...
- String Properties (String) - 코드 포인트의 문자열 속성(ASCII String, Unicode String 또는 코드 포인트)입니다.
case_folding,decomposition_mapping,name...
참고
매핑은 다소 특수하므로 ICU 문서를 참고하십시오. 예를 들어, simple_uppercase_mapping과 uppercase_mapping은 완전히 동일하지 않습니다. 다만 언어별 매핑(예: 터키어에서 i의 대문자는 「İ」(U+0130))은 구현되지 않았습니다.
numeric_value(Float64) - 코드 포인트의 숫자 값입니다.script_extensions(Array(LowCardinality(String))) - 코드 포인트의 스크립트 확장(script extensions)입니다.identifier_type(Array(LowCardinality(String))) - 코드 포인트의 식별자 유형(identifier type)입니다.general_category_mask(Int32) - 코드 포인트의 범용 카테고리 마스크(general category mask)입니다.
예시