본문으로 바로가기
본문으로 바로가기

cramersV

cramersV

도입 버전: v22.1

Cramer's V (때때로 Cramer's phi라고도 함)은 테이블의 두 컬럼 간 연관성 정도를 측정하는 통계량입니다. cramersV 함수의 결과는 0(변수들 사이에 연관성이 전혀 없음을 의미)에서 1까지의 값을 가지며, 각 값이 다른 값에 의해 완전히 결정될 때에만 1에 도달할 수 있습니다. 두 변수 간 연관성을, 해당 변수들이 가질 수 있는 최대 가능한 변동에 대한 백분율로 볼 수 있습니다.

참고

편향이 보정된 Cramer's V는 다음을 참고하십시오: cramersVBiasCorrected

구문

cramersV(column1, column2)

인수

반환값

컬럼 값 사이에 연관성이 없음을 의미하는 0부터 완전한 연관성을 의미하는 1까지의 값을 반환합니다. Float64

예시

컬럼 간 연관성이 없는 경우

SELECT
    cramersV(a, b)
FROM
    (
        SELECT
            number % 3 AS a,
            number % 5 AS b
        FROM
            numbers(150)
    )
┌─cramersV(a, b)─┐
│              0 │
└────────────────┘

컬럼 간 높은 상관관계

SELECT
    cramersV(a, b)
FROM
    (
        SELECT
            number % 10 AS a,
            number % 5 AS b
        FROM
            numbers(150)
    )
┌─────cramersV(a, b)─┐
│ 0.8944271909999159 │
└────────────────────┘