ranksum

윌콕슨 순위합 검정(Wilcoxon rank sum test)

페이지 내 모두 축소

구문

p = ranksum(x,y)

[p,h] = ranksum(x,y)

[p,h,stats] = ranksum(x,y)

[___] = ranksum(x,y,Name,Value)

설명

예제

p = ranksum(x,y)는 양측 윌콕슨 순위합 검정의 p-값을 반환합니다. ranksum은 'x와 y의 데이터가 중앙값이 같은 연속 분포에서 추출된 표본이다'는 귀무가설을 '그렇지 않다'는 대립가설에 대해 검정합니다. 이 검정에서는 두 표본이 서로 독립적이라고 가정합니다. x와 y는 길이가 서로 다를 수 있습니다.

이 검정은 만-위트니 U 검정(Mann-Whitney U-test)과 일치합니다.

예제

[p,h] = ranksum(x,y)는 검정 결과를 나타내는 논리값도 반환합니다. 결과 h = 1은 귀무가설을 기각함을 나타내고, h = 0은 5% 유의수준에서 귀무가설을 기각하지 않음을 나타냅니다.

예제

[p,h,stats] = ranksum(x,y)는 검정 통계량에 대한 정보를 포함하는 구조체 stats도 반환합니다.

예제

[___] = ranksum(x,y,Name,Value)는 하나 이상의 Name,Value 쌍 인수를 추가 옵션으로 지정하여 순위합 검정에 대해 위에 열거된 구문에 나와 있는 출력 인수를 반환합니다.

예제

모두 축소

두 모집단의 중앙값이 동일한지 검정하기

라이브 스크립트 열기

서로 독립적인 두 개의 크기가 다른 표본에 대한 중앙값이 동일하다는 가설을 검정합니다.

표본 데이터를 생성합니다.

rng('default') % for reproducibility
x = unifrnd(0,1,10,1);
y = unifrnd(0.25,1.25,15,1);

이들 표본은 해당 위치에서 0.25만큼 이동되는 것을 제외하고는 동일한 분포를 갖는 모집단에서 추출됩니다.

x 및 y의 중앙값이 동일한지 여부를 검정합니다.

p = ranksum(x,y)

p = 0.0375

$p$ -값이 0.0375이면 ranksum이 디폴트 5% 유의수준에서 중앙값이 동일하다는 귀무가설을 기각함을 나타냅니다.

두 모집단의 중앙값들에 대한 검정 통계량

라이브 스크립트 열기

두 모집단의 중앙값들이 동일한지에 대한 검정 통계량을 구합니다.

표본 데이터를 불러옵니다.

load mileage

첫 번째 유형의 자동차와 두 번째 유형의 자동차에 대해 주행거리(mpg)가 동일한지 여부를 검정합니다.

[p,h,stats] = ranksum(mileage(:,1),mileage(:,2))

p = 0.0043

h = logical
   1

stats = struct with fields:
    ranksum: 21.5000

$p$ -값이 0.043이고 h = 1이므로 디폴트 5% 유의수준에서 중앙값이 동일하다는 귀무가설이 기각됨을 나타냅니다. 표본 크기가 작으므로(각각 6개) ranksum은 정확한(Exact) 방법을 사용하여 $p$ -값을 계산합니다. 구조체 stats는 순위합 검정 통계량의 값만 포함합니다.

중앙값 증가

라이브 스크립트 열기

모집단 중앙값이 증가한다는 가설을 검정합니다.

표본 데이터를 불러옵니다.

load('weather.mat');

날씨 데이터는 2년 연속으로 같은 달에 측정한 일일 최고 기온을 보여줍니다.

1% 유의수준에서 중앙값이 증가하는지를 평가하는 왼쪽 검정을 수행합니다.

[p,h,stats] = ranksum(year1,year2,'alpha',0.01,...
'tail','left')

p = 0.1271

h = logical
   0

stats = struct with fields:
       zval: -1.1403
    ranksum: 837.5000

$p$ -값 0.1271 및 논리값 h = 0에 기반하여 귀무가설을 기각하기 위한 충분한 증거가 없습니다. 즉, 결과가 1% 유의수준에서 첫 해와 둘째 해의 월 최고 온도 중앙값이 오른쪽으로 이동되었다는 것을 보여주지 않습니다. ranksum은 표본 크기가 크기 때문에 근사(Approximate) 방법을 사용하여 $p$ -값을 계산합니다.

정확한(Exact) 방법을 사용하여 $p$ -값을 계산합니다.

[p,h,stats] = ranksum(year1,year2,'alpha',0.01,...
'tail','left','method','exact')

p = 0.1273

h = logical
   0

stats = struct with fields:
    ranksum: 837.5000

근사 방법과 정확한 방법의 결과는 서로 일치합니다.

입력 인수

모두 축소

`x` — 표본 데이터
벡터

표본 데이터로, 벡터로 지정됩니다.

데이터형: single | double

`y` — 표본 데이터
벡터

표본 데이터로, 벡터로 지정됩니다. y의 길이는 x의 길이와 같지 않아도 됩니다.

데이터형: single | double

이름-값 인수

선택적 인수 쌍을 Name1=Value1,...,NameN=ValueN으로 지정합니다. 여기서 Name은 인수 이름이고 Value는 대응값입니다. 이름-값 인수는 다른 인수 뒤에 와야 하지만, 인수 쌍의 순서는 상관없습니다.

R2021a 이전 릴리스에서는 쉼표를 사용하여 각 이름과 값을 구분하고 Name을 따옴표로 묶으십시오.

예: 'alpha',0.01,'method','approximate','tail','right'는 1% 유의수준에서 p-값 근삿값을 반환하는 오른쪽 꼬리 순위합 검정을 지정합니다.

`alpha` — 유의수준
0.05 (디폴트 값) | 범위 0~1에 속하는 스칼라 값

가설검정의 결정에 대한 유의수준으로, 'alpha'와 함께 범위 0~1 사이의 스칼라 값이 쉼표로 구분되어 지정됩니다. h의 유의수준은 100 * alpha%입니다.

예: 'alpha', 0.01

데이터형: double | single

`method` — p-값 계산 방법
`'exact'` | `'approximate'`

p-값 p를 계산하는 방법으로, 'method'와 함께 다음 중 하나가 쉼표로 구분되어 지정됩니다.

`'exact'`	정확히 p-값 `p`를 계산합니다.
`'approximate'`	정규 근사하여 p-값 `p`를 계산합니다.

'method'가 지정되지 않은 경우 디폴트 값은 다음과 같습니다.

min(n_x,n_y) < 10이고 n_x + n_y < 20인 경우 'exact'
그렇지 않은 경우 'approximate'

n_x 및 n_y는 각각 x 및 y에 포함된 표본 크기입니다.

예: 'method','exact'

`tail` — 검정 유형
`'both'` (디폴트 값) | `'right'` | `'left'`

검정 유형으로, 'tail'과 함께 다음 중 하나가 쉼표로 구분되어 지정됩니다.

`'both'`	양측 가설검정. 대립 가설은 '`x`와 `y`의 중앙값이 서로 다르다'입니다. `'tail'`이 지정되지 않은 경우 디폴트 검정 유형입니다.
`'right'`	오른쪽 꼬리 가설검정. 대립가설은 '`x`의 중앙값이 `y`의 중앙값보다 크다'입니다.
`'left'`	왼쪽 꼬리 가설검정. 대립가설은 '`x`의 중앙값이 `y`의 중앙값보다 작다'입니다.

예: 'tail','left'

출력 인수

모두 축소

`p` — 검정의 p-값
음이 아닌 스칼라

검정의 p-값으로, 0에서 1 사이의 양의 스칼라로 반환됩니다. p는 귀무가설 하의 관측값과 같거나 그보다 큰 극단적인 검정 통계량이 관측될 확률입니다. ranksum은 가장 유의미한 단측 값에 두 배를 곱하여 양측 p-값을 계산합니다.

`h` — 가설검정 결과
1 | 0

가설검정의 결과로, 논리값으로 반환됩니다.

h = 1이면 100 * alpha% 유의수준에서 귀무가설이 기각됨을 나타냅니다.
h = 0이면 100 * alpha% 유의수준에서 귀무가설이 기각되지 않음을 나타냅니다.

`stats` — 검정 통계량
구조체

검정 통계량으로, 구조체로 반환됩니다. stats에 저장되는 검정 통계량은 다음과 같습니다.

ranksum : 순위합 검정 통계량의 값
zval: z-통계량의 값('method'가 'approximate'인 경우 계산됨)

세부 정보

모두 축소

윌콕슨 순위합 검정

윌콕슨 순위합 검정(Wilcoxon rank sum test)은 표본이 서로 독립적인 경우 두 모집단에 대한 비모수적 검정입니다. X 및 Y가 표본 크기가 서로 다른 독립적인 표본인 경우 ranksum이 반환하는 검정 통계량은 첫 번째 표본의 순위합입니다.

윌콕슨 순위합 검정은 만-위트니 U 검정(Mann-Whitney U-test)과 일치합니다. 만-위트니 U 검정은 두 개의 독립 표본 X와 Y의 모집단 중앙값이 동일한지 여부를 평가하는 비모수적 검정입니다.

만-위트니 U 검정 통계량 U는 두 개의 독립 표본 X와 Y의 요소 정렬에서 y가 x 앞에 오는 횟수입니다. 이 값은 다음과 같이 윌콕슨 순위합 통계량과 관련이 있습니다. X가 크기가 n_X인 표본이면 다음과 같습니다.

$U = W - \frac{n_{X} (n_{X} + 1)}{2} .$

z-통계량

대규모 표본에 대해 ranksum은 z-통계량을 사용하여 검정에 대한 p-값의 근삿값을 계산합니다.

X와 Y가 크기가 n_X 및 n_Y인 두 개의 독립 표본인 경우 z-통계량은 다음과 같습니다(여기서 n_X < n_Y임).

$z = \frac{W - E (W)}{\sqrt{V (W)}} = \frac{W - [\frac{n_{X} n_{Y} + n_{X} (n_{X} + 1)}{2}] - 0.5 * s i g n (W - E (W))}{\sqrt{\frac{n_{X} n_{Y} (n_{X} + n_{Y} + 1 - t i e s c o r)}{12}}},$

여기에는 연속성 수정과 동순위(Tie) 조정이 적용됩니다. tiescor은 다음으로 지정됩니다.

$t i e s c o r = \frac{2 * t i e a d j}{(n_{X} + n_{Y}) (n_{X} + n_{Y} - 1)},$

여기서 ranksum은 [ranks,tieadj] = tiedrank(x,y)를 사용하여 동순위 조정값을 구합니다. 표준 정규분포는 이 z-통계량에 대한 p-값을 제공합니다.

알고리즘

ranksum은 x와 y에 있는 NaN을 누락값으로 처리하여 무시합니다.

서로 다른 표본 크기를 갖는 중앙값에 대한 양측 검정의 경우, ranksum이 반환하는 검정 통계량은 첫 번째 표본의 순위합입니다.

참고 문헌

[1] Gibbons, J. D., and S. Chakraborti. Nonparametric Statistical Inference, 5th Ed., Boca Raton, FL: Chapman & Hall/CRC Press, Taylor & Francis Group, 2011.

[2] Hollander, M., and D. A. Wolfe. Nonparametric Statistical Methods. Hoboken, NJ: John Wiley & Sons, Inc., 1999.

버전 내역

R2006a 이전에 개발됨

참고 항목

kruskalwallis | signrank | signtest | ttest2

ranksum

구문

설명

예제

두 모집단의 중앙값이 동일한지 검정하기

두 모집단의 중앙값들에 대한 검정 통계량

중앙값 증가

입력 인수

x — 표본 데이터 벡터

y — 표본 데이터 벡터

이름-값 인수

alpha — 유의수준 0.05 (디폴트 값) | 범위 0~1에 속하는 스칼라 값

method — p-값 계산 방법 'exact' | 'approximate'

tail — 검정 유형 'both' (디폴트 값) | 'right' | 'left'

출력 인수

p — 검정의 p-값 음이 아닌 스칼라

h — 가설검정 결과 1 | 0

stats — 검정 통계량 구조체

세부 정보

윌콕슨 순위합 검정

z-통계량

알고리즘

참고 문헌

버전 내역

참고 항목

`x` — 표본 데이터
벡터

`y` — 표본 데이터
벡터

`alpha` — 유의수준
0.05 (디폴트 값) | 범위 0~1에 속하는 스칼라 값

`method` — p-값 계산 방법
`'exact'` | `'approximate'`

`tail` — 검정 유형
`'both'` (디폴트 값) | `'right'` | `'left'`

`p` — 검정의 p-값
음이 아닌 스칼라

`h` — 가설검정 결과
1 | 0

`stats` — 검정 통계량
구조체