Main Content

지수 분포

개요

지수 분포는 1-모수 곡선족입니다. 지수 분포는 추가 시간 대기 확률이 이미 기다린 시간과 무관할 때 대기 시간을 모델링합니다. 예를 들어 다음번 전구 사용 시간(단위: 분) 안에 전구가 나갈 확률은 전구가 이미 몇 분 동안 사용됐는지와는 상대적으로 무관합니다.

Statistics and Machine Learning Toolbox™에서는 다음과 같이 지수 분포를 사용하는 여러 방법을 제공합니다.

  • 확률 분포를 표본 데이터에 피팅하거나(fitdist) 모수 값을 지정하여(makedist) 확률 분포 객체 ExponentialDistribution을 생성합니다. 그런 다음 객체 함수를 사용하여 분포를 실행하고, 난수를 생성하는 등의 작업을 수행합니다.

  • 분포 피팅기 앱을 사용하여 대화형 방식으로 지수 분포를 사용합니다. 앱에서 객체를 내보내고 객체 함수를 사용할 수 있습니다.

  • 분포 전용 함수(expcdf, exppdf, expinv, explike, expstat, expfit, exprnd)를 지정된 분포 모수와 함께 사용합니다. 분포 전용 함수는 여러 지수 분포의 모수를 받을 수 있습니다.

  • 일반 분포 함수(cdf, icdf, pdf, random)를 지정된 분포 이름('Exponential') 및 모수와 함께 사용합니다.

모수

지수 분포는 다음 모수를 사용합니다.

모수설명지원
mu (μ)평균μ > 0

모수 μ는 지수 분포의 표준편차와도 같습니다.

표준 지수 분포는 μ=1을 갖습니다.

지수 분포 모수화에 대한 일반적인 대체 방법은 사건이 발생하기까지 기다리는 시간의 평균인 μ 대신에, 간격 내 사건 수의 평균으로 정의되는 λ를 사용하는 것입니다. λ와 μ는 서로 역수입니다.

모수 추정

가능도 함수는 모수의 함수로 표시되는 확률 밀도 함수(pdf)입니다. 최대가능도 추정값(MLE)은 x의 고정 값에 대해 가능도 함수를 최대화하는 모수 추정값입니다.

지수 분포에 대한 μ의 최대가능도는 x¯=i=1nxin입니다. 여기서 x¯는 표본 x1, x2, …, xn에 대한 표본평균입니다. 표본평균은 모수 μ의 무편향 추정량입니다.

지수 분포를 데이터에 피팅하고 모수 추정값을 구하려면 expfit, fitdist 또는 mle를 사용합니다. 모수 추정값을 반환하는 expfitmle와 달리, fitdist는 피팅된 확률 분포 객체 ExponentialDistribution을 반환합니다. 객체 속성 mu는 모수 추정값을 저장합니다.

예제는 지수 분포를 데이터에 피팅하기 항목을 참조하십시오.

확률 밀도 함수

지수 분포의 pdf는 다음과 같습니다.

y=f(x|μ)=1μexμ.

예제는 지수 분포의 pdf 계산하기 항목을 참조하십시오.

누적 분포 함수

지수 분포의 누적 분포 함수(cdf)는 다음과 같습니다.

p=F(x|u)=0x1μetμdt=1exμ.

결과 p는 평균 μ를 갖는 지수 분포에서 단일 관측값이 구간 [0, x]에 속할 확률입니다.

예제는 지수 분포의 cdf 계산하기 항목을 참조하십시오.

역누적 분포 함수

지수 분포의 역누적 분포 함수(icdf)는 다음과 같습니다.

x=F1(p|μ)=μln(1p).

결과 x는 모수 μ를 갖는 지수 분포에서 한 관측값이 확률 p로 범위 [0 x]에 속하는 값입니다.

위험 함수

위험 함수(순간실패율)는 pdf의 비율과 cdf의 보수입니다. f(t)와 F(t)가 각각 분포의 pdf와 cdf이면 위험률은 h(t)=f(t)1F(t)입니다. f(t)와 F(t)를 지수 분포의 pdf와 cdf로 대체하면 상수 λ가 생성됩니다. 지수 분포는 일정한 위험 함수를 갖는 유일한 연속 분포입니다. λ는 μ의 역수이며 주어진 구간에서 이벤트가 발생하는 비율로 해석될 수 있습니다. 따라서 생존 시간 모델링 시 항목이 추가 시간 단위로 생존할 확률은 항목의 현재 수명과 무관합니다.

예제는 지수적으로 분포된 수명 항목을 참조하십시오.

예제

지수 분포를 데이터에 피팅하기

평균은 700이고 지수적으로 분포된 난수 중 100개를 포함하는 표본을 생성합니다.

x = exprnd(700,100,1); % Generate sample

fitdist를 사용하여 지수 분포를 데이터에 피팅합니다.

pd = fitdist(x,'exponential')
pd = 
  ExponentialDistribution

  Exponential distribution
    mu = 641.934   [532.598, 788.966]

fitdistExponentialDistribution 객체를 반환합니다. 모수 추정값 다음에 있는 구간은 분포 모수에 대한 95% 신뢰구간입니다.

분포 함수를 사용하여 모수를 추정합니다.

[muhat,muci] = expfit(x) % Distribution specific function
muhat = 641.9342
muci = 2×1

  532.5976
  788.9660

[muhat2,muci2] = mle(x,'distribution','exponential') % Generic distribution function
muhat2 = 641.9342
muci2 = 2×1

  532.5976
  788.9660

지수 분포의 pdf 계산하기

모수 mu = 2를 갖는 지수 분포의 pdf를 계산합니다.

x = 0:0.1:10;
y = exppdf(x,2);

pdf를 플로팅합니다.

figure;
plot(x,y)
xlabel('Observation')
ylabel('Probability Density')

Figure contains an axes object. The axes object with xlabel Observation, ylabel Probability Density contains an object of type line.

지수 분포의 cdf 계산하기

모수 mu = 2를 갖는 지수 분포의 cdf를 계산합니다.

x = 0:0.1:10;
y = expcdf(x,2);

cdf를 플로팅합니다.

figure;
plot(x,y)
xlabel('Observation')
ylabel('Cumulative Probability')

Figure contains an axes object. The axes object with xlabel Observation, ylabel Cumulative Probability contains an object of type line.

지수적으로 분포된 수명

1에서 5까지의 값에서 평균 mu = 2를 갖는 지수 분포의 위험 함수를 계산합니다.

x = 1:5;
lambda1 = exppdf(x,2)./(1-expcdf(x,2))
lambda1 = 1×5

    0.5000    0.5000    0.5000    0.5000    0.5000

지수 분포의 위험 함수(생존에 대한 순간실패율)는 일정하며 항상 1/mu와 같습니다. 이 상수는 대개 λ로 표시됩니다.

x = 3에서 1에서 5까지의 평균을 갖는 지수 분포의 위험 함수를 계산합니다.

mu = 1:5;
lambda2 = exppdf(3,mu)./(1-expcdf(3,mu))
lambda2 = 1×5

    1.0000    0.5000    0.3333    0.2500    0.2000

지수적으로 분포된 수명을 가진 항목이 한 단위의 시간을 더 생존할 확률은 항목이 얼마나 오래 생존했는지와 무관합니다.

평균 생존 기간이 10년일 때 다양한 수명대에서 항목이 1년 더 생존할 확률을 계산합니다.

x2 = 5:5:25;
x3 = x2 + 1;
deltap = (expcdf(x3,10)-expcdf(x2,10))./(1-expcdf(x2,10))
deltap = 1×5

    0.0952    0.0952    0.0952    0.0952    0.0952

1년 더 생존할 확률은 항목이 이미 얼마나 오래 생존해 있었는지와 상관없이 동일합니다.

관련 분포

  • Burr Type XII Distribution — 버 분포(Burr Distribution)는 3-모수 연속 분포입니다. 평균에서 감마 분포와 복합된 지수 분포는 버 분포를 생성합니다.

  • 감마 분포 — 감마 분포는 모수 a(형태) 및 b(스케일)를 갖는 2-모수 연속 분포입니다. a = 1인 경우, 감마 분포는 평균이 μ = b인 지수 분포와 같습니다. 평균 μ를 갖는 k개의 지수적으로 분포된 확률 변수의 합은 모수가 a = kμ = b인 감마 분포를 가집니다.

  • Geometric Distribution — 기하분포는 반복된 베르누이 시행에서 첫 번째 성공 이전의 총 실패 횟수를 모델링하는 1-모수 이산 분포입니다. 기하분포는 지수 분포의 이산 아날로그이며 일정한 위험 함수를 갖는 유일한 이산 분포입니다.

  • Generalized Pareto Distribution — 일반화 파레토 분포는 모수 k(형태), σ(스케일), θ(임계값)를 갖는 3-모수 연속 분포입니다. k = 0이고 θ = 0인 경우, 일반화 파레토 분포는 평균이 μ = σ인 지수 분포와 같습니다.

  • 푸아송 분포 — 푸아송 분포는 음이 아닌 정수 값을 받는 1-모수 이산 분포입니다. 모수 λ는 분포의 평균이자 분산입니다. 푸아송 분포 모델은 주어진 시간에서 임의 사건이 발생하는 횟수를 셉니다. 이러한 모델에서 사건 발생 사이의 시간은 평균이 1λ인 지수 분포로 모델링됩니다.

  • 베이불(Weibull) 분포 — 베이불 분포는 모수 a(스케일) 및 b(형태)를 갖는 2-모수 연속 분포입니다. 베이불 분포는 수명을 모델링하는 데에도 사용되지만 일정한 위험률을 가지지 않습니다. b = 1인 경우, 베이불 분포는 평균이 μ = a인 지수 분포와 같습니다.

    예제는 지수 분포와 베이불 분포의 위험 함수 비교하기 항목을 참조하십시오.

참고 문헌

[1] Crowder, Martin J., ed. Statistical Analysis of Reliability Data. Reprinted. London: Chapman & Hall, 1995.

[2] Kotz, Samuel, and Saralees Nadarajah. Extreme Value Distributions: Theory and Applications. London : River Edge, NJ: Imperial College Press; Distributed by World Scientific, 2000.

[3] Meeker, William Q., and Luis A. Escobar. Statistical Methods for Reliability Data. Wiley Series in Probability and Statistics. Applied Probability and Statistics Section. New York: Wiley, 1998.

[4] Lawless, Jerald F. Statistical Models and Methods for Lifetime Data. 2nd ed. Wiley Series in Probability and Statistics. Hoboken, N.J: Wiley-Interscience, 2003.

참고 항목

| | | | | | | | |

관련 항목