zscore

Z = zscore(X)는 X의 각 요소에 대한 z-점수를 반환합니다. X의 열은 평균 0을 갖도록 중심화되고 표준편차 1을 갖도록 크기가 조정됩니다. 즉, 정규화됩니다. Z는 X와 크기가 같습니다.

X가 벡터이면 Z는 z-점수로 구성된 벡터입니다.
X가 행렬이면 Z는 X와 같은 크기의 행렬이고, Z의 각 열은 평균이 0이고 표준편차가 1입니다.
다차원 배열의 경우 Z의 z-점수는 X의 첫 번째 비한원소 차원을 따라 계산됩니다.

Z = zscore(X,flag)는 flag가 지시하는 표준편차를 사용하여 X의 크기를 조정합니다.

flag가 0(디폴트 값)이면 zscore가 표준편차 공식의 분모를 n - 1로 하고 표본 표준편차를 사용하여 X의 크기를 조정합니다. zscore(X,0)은 zscore(X)와 같습니다.
flag가 1이면 zscore가 표준편차 공식의 분모를 n으로 하고 모집단 표준편차를 사용하여 X의 크기를 조정합니다.

Z = zscore(X,flag,'all')은 X에 포함된 모든 값에 대한 평균 및 표준편차를 사용하여 X를 표준화합니다.

Z = zscore(X,flag,dim)은 연산 차원 dim을 따라 X를 표준화합니다. 예를 들어, 행렬 X에 대해 dim = 1이면 zscore는 X의 열을 따라 평균과 표준편차를 사용하고, dim = 2이면 zscore는 X의 행을 따라 평균과 표준편차를 사용합니다.

Z = zscore(X,flag,vecdim)은 벡터 vecdim으로 지정된 차원을 따라 X를 표준화합니다. 예를 들어, X가 행렬이면 행렬의 모든 요소가 차원 1과 차원 2로 정의된 배열 슬라이스에 포함되기 때문에 zscore(X,0,[1 2])는 zscore(X,0,'all')과 같습니다.

[Z,mu,sigma] = zscore(___)는 정규화에 사용되는 평균과 표준편차를 각각 mu와 sigma로 반환합니다. 위에 열거된 구문의 모든 입력 인수와 사용할 수 있습니다.

예제

두 데이터 벡터의 Z-점수

두 데이터 벡터의 $z$ -점수를 계산하고 플로팅한 후 결과를 비교합니다.

표본 데이터를 불러옵니다.

load lawdata

두 변수 gpa와 lsat가 작업 공간에 들어옵니다.

동일한 좌표축에 두 변수를 모두 플로팅합니다.

plot([gpa,lsat])
legend('gpa','lsat','Location','East')

Figure contains an axes object. The axes object contains 2 objects of type line. These objects represent gpa, lsat.

이 두 측정값은 척도가 매우 다르므로 비교하기가 어렵습니다.

gpa와 lsat의 $z$ -점수를 동일한 좌표축에 플로팅합니다.

Zgpa = zscore(gpa);
Zlsat = zscore(lsat);
plot([Zgpa, Zlsat])
legend('gpa z-scores','lsat z-scores','Location','Northeast')

Figure contains an axes object. The axes object contains 2 objects of type line. These objects represent gpa z-scores, lsat z-scores.

이제, gpa 결과 및 lsat 결과와 관련하여 개인의 상대적인 성과를 볼 수 있습니다. 예를 들어, 세 번째 개인의 gpa 결과와 lsat 결과는 모두 표본평균보다 1 표준편차 아래에 있습니다. 11번째 개인의 gpa는 표본평균에 가깝지만, lsat 점수는 표본평균보다 거의 1.25 표준편차 위에 있습니다.

생성한 $z$ -점수의 평균과 표준편차를 확인합니다.

 mean([Zgpa,Zlsat])

ans = 1×2
10^-14 ×

   -0.1088    0.0357

 std([Zgpa,Zlsat])

ans = 1×2

     1     1

정의에 따라 gpa 및 lsat의 $z$ -점수는 평균이 0이고 표준편차가 1입니다.

표본에 대한 모집단의 Z-점수

표본 데이터를 불러옵니다.

load lawdata

두 변수 gpa와 lsat가 작업 공간에 들어옵니다.

모집단 표준편차 공식을 사용하여 gpa의 $z$ -점수를 계산합니다.

Z1 = zscore(gpa,1); % population formula
Z0 = zscore(gpa,0); % sample formula
disp([Z1 Z0])

    1.2554    1.2128
    0.8728    0.8432
   -1.2100   -1.1690
   -0.2749   -0.2656
    1.4679    1.4181
   -0.1049   -0.1013
   -0.4024   -0.3888
    1.4254    1.3771
    1.1279    1.0896
    0.1502    0.1451
    0.1077    0.1040
   -1.5076   -1.4565
   -1.4226   -1.3743
   -0.9125   -0.8815
   -0.5724   -0.5530

모집단에서 추출한 표본의 경우, 분모로 $n$ 을 갖는 모집단 표준편차 공식은 모집단 표준편차의 최대가능도 추정값에 대응되고 편향적일 수 있습니다. 반면, 표본 표준편차 공식은 표본에 대한 모집단 표준편차의 무편향 추정량입니다.

데이터 행렬의 Z-점수

데이터 행렬의 열 또는 행을 따라 계산된 평균 및 표준편차를 사용하여 $z$ -점수를 계산합니다.

표본 데이터를 불러옵니다.

load flu

dataset형 배열 flu가 작업 공간에 들어옵니다. flu는 11개 변수에 대한 52개의 관측값을 가집니다. 첫 번째 변수는 날짜(단위: 주)를 포함합니다. 나머지 변수는 미국의 여러 지역에 대한 독감 추정값을 포함합니다.

dataset형 배열을 데이터 행렬로 변환합니다.

flu2 = double(flu(:,2:end));

새 데이터 행렬 flu2는 52×10 double형 데이터 행렬입니다. 데이터 세트 배열 flu에서 행은 주에 대응되고 열은 미국 지역에 대응됩니다.

각 지역(flu2의 열)에 대한 독감 추정값을 표준화합니다.

Z1 = zscore(flu2,[ ],1);

작업 공간에 생성된 행렬 Z1을 더블 클릭하여 변수 편집기에서 $z$ -점수를 확인할 수 있습니다.

각 주(flu2의 행)에 대한 독감 추정값을 표준화합니다.

Z2 = zscore(flu2,[ ],2);

다차원 배열의 Z-점수

여러 차원을 따라 데이터를 표준화하도록 지정하여 다차원 배열의 z-점수를 구합니다. 'all', dim, vecdim 입력 인수를 사용하는 경우의 결과를 비교합니다.

3×4×2 배열을 생성합니다.

X = reshape(1:24,[3 4 2])

X = 
X(:,:,1) =

     1     4     7    10
     2     5     8    11
     3     6     9    12


X(:,:,2) =

    13    16    19    22
    14    17    20    23
    15    18    21    24

X에 포함된 모든 값에 대한 평균 및 표준편차를 사용하여 X를 표준화합니다.

Zall = zscore(X,0,'all')

Zall = 
Zall(:,:,1) =

   -1.6263   -1.2021   -0.7778   -0.3536
   -1.4849   -1.0607   -0.6364   -0.2121
   -1.3435   -0.9192   -0.4950   -0.0707


Zall(:,:,2) =

    0.0707    0.4950    0.9192    1.3435
    0.2121    0.6364    1.0607    1.4849
    0.3536    0.7778    1.2021    1.6263

결과로 생성되는, z-점수로 구성된 다차원 배열은 평균이 0이고 표준편차가 1입니다. 예를 들어, Zall의 평균 및 표준편차를 계산합니다.

mZall = mean(Zall(:,:,:),'all')

mZall = -9.2519e-18

sZall = std(Zall(:,:,:),0,'all')

sZall = 1.0000

이제, 두 번째 차원을 따라 X를 표준화합니다.

Zdim = zscore(X,0,2)

Zdim = 
Zdim(:,:,1) =

   -1.1619   -0.3873    0.3873    1.1619
   -1.1619   -0.3873    0.3873    1.1619
   -1.1619   -0.3873    0.3873    1.1619


Zdim(:,:,2) =

   -1.1619   -0.3873    0.3873    1.1619
   -1.1619   -0.3873    0.3873    1.1619
   -1.1619   -0.3873    0.3873    1.1619

Zdim의 각 페이지에서 각 행의 요소는 평균이 0이고 표준편차가 1입니다. 예를 들어, Zdim의 두 번째 페이지에서 첫 번째 행의 평균 및 표준편차를 계산합니다.

mZdim = mean(Zdim(1,:,2),'all')

mZdim = 0

sZdim = std(Zdim(1,:,2),0,'all')

sZdim = 1

마지막으로, 두 번째 차원과 세 번째 차원을 기준으로 X를 표준화합니다.

Zvecdim = zscore(X,0,[2 3])

Zvecdim = 
Zvecdim(:,:,1) =

   -1.4289   -1.0206   -0.6124   -0.2041
   -1.4289   -1.0206   -0.6124   -0.2041
   -1.4289   -1.0206   -0.6124   -0.2041


Zvecdim(:,:,2) =

    0.2041    0.6124    1.0206    1.4289
    0.2041    0.6124    1.0206    1.4289
    0.2041    0.6124    1.0206    1.4289

각 Zvecdim(i,:,:) 슬라이스의 요소는 평균이 0이고 표준편차가 1입니다. 예를 들어, Zvecdim(1,:,:)에 포함된 요소의 평균과 표준편차를 계산해 봅니다.

mZvecdim = mean(Zvecdim(1,:,:),'all')

mZvecdim = 2.7756e-17

sZvecdim = std(Zvecdim(1,:,:),0,'all')

sZvecdim = 1

Z-점수, 평균, 표준편차

$z$ -점수를 계산하는 데 사용된 평균과 표준편차를 반환합니다.

표본 데이터를 불러옵니다.

load lawdata

두 변수 gpa와 lsat가 작업 공간에 들어옵니다.

gpa의 $z$ -점수, 평균, 표준편차를 반환합니다.

[Z,gpamean,gpastdev] = zscore(gpa)

gpamean = 3.0947

gpastdev = 0.2435

입력 인수

`X` — 입력 데이터
벡터 | 행렬 | 다차원 배열

입력 데이터로, 벡터, 행렬 또는 다차원 배열로 지정됩니다.

데이터형: double | single

`flag` — 표준편차를 지시하는 표시자
0 (디폴트 값) | 1

z-점수를 계산하는 데 사용되는 표준편차를 지시하는 표시자로, 0 또는 1로 지정됩니다.

flag가 0(디폴트 값)이면 zscore가 표본 표준편차를 사용하여 X의 크기를 조정합니다. zscore(X,0)은 zscore(X)와 같습니다.
flag가 1이면 zscore가 모집단 표준편차를 사용하여 X의 크기를 조정합니다.

`dim` — 차원
양의 정수 스칼라

X의 z-점수를 계산할 차원으로, 양의 정수 스칼라로 지정됩니다. 값을 지정하지 않으면 디폴트 값은 크기가 1이 아닌 첫 번째 배열 차원이 됩니다.

예를 들어, 행렬 X에 대해 dim = 1이면 zscore는 X의 열을 따라 평균과 표준편차를 사용하고, dim = 2이면 zscore는 X의 행을 따라 평균과 표준편차를 사용합니다.

`vecdim` — 차원의 벡터
양의 정수 벡터

X의 z-점수를 계산할 차원으로 구성된 벡터로, 양의 정수 벡터로 지정됩니다. vecdim의 각 요소는 입력 배열 X의 차원을 나타냅니다. 출력값 Z는 X와 동일한 차원을 가지지만, 평균 mu 및 표준편차 sigma는 각각 연산 차원에서 길이가 1입니다. 다른 차원 길이는 X, mu, sigma에서 같습니다.

예를 들어, X가 2×3×3 배열이면 zscore(X,0,[1 2])는 X의 페이지를 따라 평균 및 표준편차를 사용하여 X의 값을 표준화합니다.

데이터형: single | double

출력 인수

`Z` — z-점수
벡터 | 행렬 | 다차원 배열

z-점수로, 벡터, 행렬 또는 다차원 배열로 반환됩니다. Z는 X와 동일한 차원을 가집니다.

Z의 값은 사용자가 'all', dim 또는 vecdim 중 무엇을 지정하는지에 따라 달라집니다. 이러한 입력 인수를 지정하지 않을 경우 다음 조건이 적용됩니다.

X가 벡터이면 Z는 평균이 0이고 분산이 1인 z-점수로 구성된 벡터입니다.
X가 배열이면 zscore는 X의 첫 번째 비한원소 차원을 따라 표준화합니다.

'all', dim, vecdim을 사용할 때 Z의 차이를 보여주는 예는 다차원 배열의 Z-점수 항목을 참조하십시오.

`mu` — 평균
스칼라 | 벡터 | 행렬 | 다차원 배열

z-점수를 계산하는 데 사용되는 X의 평균으로, 스칼라, 벡터, 행렬 또는 다차원 배열로 반환됩니다. mu는 지정된 연산 차원에서 길이가 1입니다. 다른 차원 길이는 X 및 mu에서 같습니다.

예를 들어, X가 2×3×3 배열이고 vecdim이 [1 2]이면 mu는 평균으로 구성된 1×1×3 배열입니다. mu의 각 값은 X의 페이지의 평균에 해당합니다.

Mapping of input dimension of 2-by-3-by-3 to output dimension of 1-by-1-by-3

`sigma` — 표준편차
스칼라 | 벡터 | 행렬 | 다차원 배열

z-점수를 계산하는 데 사용되는 X의 표준편차로, 스칼라, 벡터, 행렬 또는 다차원 배열로 반환됩니다. sigma는 지정된 연산 차원에서 길이가 1입니다. 다른 차원 길이는 X 및 sigma에서 같습니다.

예를 들어, X가 2×3×3 배열이고 vecdim이 [1 2]이면 sigma는 표준편차로 구성된 1×1×3 배열입니다. sigma의 각 값은 X의 페이지의 표준편차에 해당합니다.

Mapping of input dimension of 2-by-3-by-3 to output dimension of 1-by-1-by-3

세부 정보