본문으로 바로가기
본문으로 바로가기

meanZTest

meanZTest

도입된 버전: v22.2

두 모집단에서 추출한 표본에 평균 z-검정(mean z-test)을 적용합니다.

두 표본의 값은 모두 sample_data 컬럼에 있습니다. sample_index가 0이면 해당 행의 값은 첫 번째 모집단에서 나온 표본에 속합니다. 그 외의 값이면 두 번째 모집단에서 나온 표본에 속합니다. 귀무가설은 두 모집단의 평균이 같다는 것입니다. 정규분포를 가정합니다. 모집단은 서로 다른 분산을 가질 수 있으며, 이 분산 값들은 미리 알려져 있습니다.

구문

meanZTest(population_variance_x, population_variance_y, confidence_level)(sample_data, sample_index)

매개변수

  • population_variance_x — 모집단 x의 분산. Float*
  • population_variance_y — 모집단 y의 분산. Float*
  • confidence_level — 신뢰 구간을 계산하기 위한 신뢰수준. Float*

인수(Arguments)

반환 값

네 개의 요소(계산된 z-통계량, 계산된 p-값, 계산된 신뢰 구간 하한값, 계산된 신뢰 구간 상한값)를 가진 튜플을 반환합니다. Tuple(Float64, Float64, Float64, Float64)

예시

평균 Z-검정 예시

CREATE TABLE mean_ztest (sample_data Float64, sample_index UInt8) ENGINE = Memory;
INSERT INTO mean_ztest VALUES (20.3, 0), (21.9, 0), (22.1, 0), (18.9, 1), (19, 1), (20.3, 1);

SELECT meanZTest(0.7, 0.45, 0.95)(sample_data, sample_index) FROM mean_ztest;
┌─meanZTest(0.7, 0.45, 0.95)(sample_data, sample_index)───────────────────────────────┐
│ (3.2841296025548123, 0.0010229786769086013, 0.8198428246768334, 3.2468238419898365) │
└─────────────────────────────────────────────────────────────────────────────────────┘