mannWhitneyUTest

도입 버전: v21.1

두 모집단에서 가져온 표본에 Mann-Whitney 순위 검정을 적용합니다.

두 표본의 값은 모두 sample_data 컬럼에 있습니다. sample_index가 0이면 해당 행의 값은 첫 번째 모집단에서 나온 표본에 속합니다. 그 외의 경우에는 두 번째 모집단에서 나온 표본에 속합니다. 귀무가설은 두 모집단이 동일한 분포를 가진다는 것입니다. 또한 단측 가설도 검정할 수 있습니다. 이 검정은 데이터가 정규분포를 따른다고 가정하지 않습니다.

구문

mannWhitneyUTest[(alternative[, continuity_correction])](sample_data, sample_index)

매개변수

alternative — 선택 사항입니다. 대립가설을 지정합니다. 'two-sided'(기본값): 두 모집단은 확률적으로 동일하지 않습니다. 'greater': 첫 번째 표본의 값이 두 번째 표본의 값보다 확률적으로 더 큽니다. 'less': 첫 번째 표본의 값이 두 번째 표본의 값보다 확률적으로 더 작습니다. String
continuity_correction — 선택 사항입니다. 0이 아니면 p-value에 대한 정규 근사에서 연속성 보정을 적용합니다. 기본값은 1입니다. UInt64

인수

sample_data — 표본 데이터입니다. (U)Int* 또는 Float* 또는 Decimal*
sample_index — 표본 인덱스입니다. (U)Int*

반환 값

두 요소를 가진 튜플을 반환합니다. 계산된 U-통계량과 계산된 p-value입니다. Tuple(Float64, Float64)

예시

Mann-Whitney U 검정 예시

CREATE TABLE mww_ttest (sample_data Float64, sample_index UInt8) ENGINE = Memory;
INSERT INTO mww_ttest VALUES (10, 0), (11, 0), (12, 0), (1, 1), (2, 1), (3, 1);

SELECT mannWhitneyUTest('greater')(sample_data, sample_index) FROM mww_ttest;

┌─mannWhitneyUTest('greater')(sample_data, sample_index)─┐
│ (9,0.04042779918503192)                                │
└────────────────────────────────────────────────────────┘

참고

mannWhitneyUTest​

mannWhitneyUTest