Main Content

이항분포

개요

이항분포는 2-모수 곡선족입니다. 이항분포는 공정한 동전을 10회 던질 때 앞면이 주어진 횟수만큼 나올 확률을 모델링하는 것과 같이, 성공 확률이 동일한 고정된 횟수의 독립 시행에서 총 성공 횟수를 모델링하는 데 사용됩니다.

Statistics and Machine Learning Toolbox™에서는 다음과 같이 이항분포를 사용하는 여러 방법을 제공합니다.

  • 확률 분포를 표본 데이터에 피팅하거나(fitdist) 모수 값을 지정하여(makedist) 확률 분포 객체 BinomialDistribution을 생성합니다. 그런 다음 객체 함수를 사용하여 분포를 실행하고, 난수를 생성하는 등의 작업을 수행합니다.

  • 분포 피팅기 앱을 사용하여 대화형 방식으로 이항분포를 사용합니다. 앱에서 객체를 내보내고 객체 함수를 사용할 수 있습니다.

  • 지정된 분포 모수를 이용해 분포 전용 함수(binocdf, binopdf, binoinv, binostat, binofit, binornd)를 사용합니다. 분포 전용 함수는 여러 이항분포의 모수를 받을 수 있습니다.

  • 일반 분포 함수(cdf, icdf, pdf, random)를 지정된 분포 이름('Binomial') 및 모수와 함께 사용합니다.

모수

이항분포는 다음 모수를 사용합니다.

모수설명지원
N시행 횟수양의 정수
p단일 시행에서 성공할 확률0p1

둘 다 동일한 모수 p를 갖는 두 이항 확률 변수의 합은 N이 이들 시행 횟수의 합과 같은 하나의 이항 확률 변수이기도 합니다.

확률 밀도 함수

이항분포의 확률 밀도 함수(pdf)는 다음과 같습니다.

f(x|N,p)=(Nx)px(1p)Nx;x=0,1,2,...,N,

여기서 x는 성공 확률이 p인 베르누이 과정의 N회 시행에서 성공 횟수입니다. 그 결과는 N회의 시행에서 정확히 x회의 성공 확률입니다. 이산 분포의 경우, pdf는 확률 질량 함수(pmf)로도 알려져 있습니다.

예제는 이항분포 pdf 계산하기 항목을 참조하십시오.

누적 분포 함수

이항분포의 누적 분포 함수(cdf)는 다음과 같습니다.

F(x|N,p)=i=0x(Ni)pi(1p)Ni;x=0,1,2,...,N,

여기서 x는 성공 확률이 p인 베르누이 과정의 N회 시행에서 성공 횟수입니다. 그 결과는 N회의 시행에서 최대 x회의 성공 확률입니다.

예제는 이항분포 cdf 계산하기 항목을 참조하십시오.

기술 통계량

이항분포의 평균은 Np입니다.

이항분포의 분산은 Np(1 – p)입니다.

이항분포를 데이터에 피팅하기

각 시행에서 성공 확률 0.9100회 시행의 성공 횟수를 세는 이항 난수를 생성합니다.

x = binornd(100,0.9)
x = 85

fitdist를 사용하여 이항분포를 데이터에 피팅합니다.

pd = fitdist(x,'Binomial','NTrials',100)
pd = 
  BinomialDistribution

  Binomial distribution
    N =  100
    p = 0.85   [0.764692, 0.913546]

fitdistBinomialDistribution 객체를 반환합니다. p 옆의 구간은 p를 추정하는 95% 신뢰구간입니다.

분포 함수를 사용하여 모수 p를 추정합니다.

[phat,pci] = binofit(x,100) % Distribution-specific function
phat = 0.8500
pci = 1×2

    0.7647    0.9135

[phat2,pci2] = mle(x,'distribution','Binomial',"NTrials",100) % Generic distribution function
phat2 = 0.8500
pci2 = 2×1

    0.7647
    0.9135

이항분포 pdf 계산하기

시행 횟수가 10이고 성공 확률이 0.5인 이항분포의 pdf를 계산합니다.

x = 0:10;
y = binopdf(x,10,0.5);

너비가 1인 막대로 pdf를 플로팅합니다.

figure
bar(x,y,1)
xlabel('Observation')
ylabel('Probability')

Figure contains an axes object. The axes object with xlabel Observation, ylabel Probability contains an object of type bar.

이항분포 cdf 계산하기

시행 횟수가 10이고 성공 확률이 0.5인 이항분포의 cdf를 계산합니다.

x = 0:10;
y = binocdf(x,10,0.5);

cdf를 플로팅합니다.

figure
stairs(x,y)
xlabel('Observation')
ylabel('Cumulative Probability')

Figure contains an axes object. The axes object with xlabel Observation, ylabel Cumulative Probability contains an object of type stair.

이항분포 pdf와 정규분포 pdf 비교하기

N이 크면 모수가 Np인 이항분포는 p가 너무 크거나 너무 작지 않을 경우 평균 N*p와 분산 N*p*(1–p)를 갖는 정규분포로 근사할 수 있습니다.

단일 시행에서 0.6의 확률로 50회 시행 시 성공 횟수를 세는 이항분포의 pdf를 계산합니다.

N = 50;
p = 0.6;
x1 = 0:N;
y1 = binopdf(x1,N,p);

대응되는 정규분포의 pdf를 계산합니다.

mu = N*p;
sigma = sqrt(N*p*(1-p));
x2 = 0:0.1:N;
y2 = normpdf(x2,mu,sigma);

동일한 축에 pdf를 플로팅합니다.

figure
bar(x1,y1,1)
hold on
plot(x2,y2,'LineWidth',2)
xlabel('Observation')
ylabel('Probability')
title('Binomial and Normal pdfs')
legend('Binomial Distribution','Normal Distribution','location','northwest')
hold off

Figure contains an axes object. The axes object with title Binomial and Normal pdfs, xlabel Observation, ylabel Probability contains 2 objects of type bar, line. These objects represent Binomial Distribution, Normal Distribution.

정규분포의 pdf가 이항분포의 pdf에 가깝습니다.

이항분포 pdf와 푸아송 분포 pdf 비교하기

p가 작으면 모수가 Np인 이항분포는 N*p도 작을 경우 평균 N*p를 갖는 푸아송 분포로 근사할 수 있습니다.

단일 시행에서 0.05의 성공 확률로 20회 시행 시 성공 횟수를 세는 이항분포의 pdf를 계산합니다.

N = 20;
p = 0.05;
x = 0:N;
y1 = binopdf(x,N,p);

대응되는 푸아송 분포의 pdf를 계산합니다.

mu = N*p;
y2 = poisspdf(x,mu);

동일한 축에 pdf를 플로팅합니다.

figure
bar(x,[y1; y2])
xlabel('Observation')
ylabel('Probability')
title('Binomial and Poisson pdfs')
legend('Binomial Distribution','Poisson Distribution','location','northeast')

Figure contains an axes object. The axes object with title Binomial and Poisson pdfs, xlabel Observation, ylabel Probability contains 2 objects of type bar. These objects represent Binomial Distribution, Poisson Distribution.

푸아송 분포의 pdf가 이항분포의 pdf에 가깝습니다.

관련 분포

  • 베르누이 분포 — 베르누이 분포는 단일 시행의 성공을 모델링하는 1-모수 이산 분포로, N = 1인 이항분포로 발생합니다.

  • 다항 분포 — 다항 분포는 각 시행에 가능한 결과가 세 가지 이상일 때 이항분포를 일반화하는 이산 분포입니다.

  • 정규분포 — 정규분포는 모수 μ(평균)와 σ(표준편차)를 갖는 2-모수 연속 분포입니다. N이 커지면 이항분포는 µ = Npσ2 = Np(1 – p)를 갖는 정규분포로 근사할 수 있습니다. 이항분포 pdf와 정규분포 pdf 비교하기 항목을 참조하십시오.

  • 푸아송 분포 — 푸아송 분포는 음이 아닌 정수 값을 취하는 1-모수 이산 분포입니다. 모수 λ는 분포의 평균이자 분산입니다. 푸아송 분포는 Np = λ일 때 무한대에 가까운 N과 0에 가까운 p를 갖는 이항분포가 나타내는 극한 분포입니다. 이항분포 pdf와 푸아송 분포 pdf 비교하기 항목을 참조하십시오.

참고 문헌

[1] Abramowitz, Milton, and Irene A. Stegun, eds. Handbook of Mathematical Functions: With Formulas, Graphs, and Mathematical Tables. 9. Dover print.; [Nachdr. der Ausg. von 1972]. Dover Books on Mathematics. New York, NY: Dover Publ, 2013.

[2] Evans, Merran, Nicholas Hastings, and Brian Peacock. Statistical Distributions. 2nd ed. New York: J. Wiley, 1993.

[3] Loader, Catherine. Fast and Accurate Computation of Binomial Probabilities. July 9, 2000.

참고 항목

| | | | | | | |

관련 항목