1. t 분포 (t Distribution)
ㅇ 정규분포의 평균의 해석에 많이 쓰이는 분포
- 주로, 모집단이 정규분포라는 정도 만 알고, 모 표준편차는 모를 때,
- 소 표본(n<30)으로도, 모 평균을 추정하려고,
- 정규분포 대신에 사용되는 확률분포
※ t 분포는 아일랜드 통계 학자 William Sealey Gosset(1876~1937)에 의해 발견
- Student라는 가명으로 논문을 발표하여 Student t-분포 라고도 함
- 후에, 피셔(R.A.Fisher)가 t 분포 이론을 일반화시켜 정립함
※ [참고] ☞ t 검정 참조
2. t 분포의 형태
ㅇ 표준정규분포와 유사하게, 0 을 중심으로 좌우대칭 이나,
- 표준정규분포 보다 평평하고 기다란 꼬리를 갖음 (양쪽 꼬리가 두터운 형태)
- 즉, 표준정규분포 보다 분산이 크므로, 보다 평평한 모양을 갖음
ㅇ 자유도에 따라 다른 모양을 나타냄 (χ² 분포 도 이와 유사함)
- 자유도(= 표본의 수 - 1)가 증가할수록, 표준정규분포에 가까워짐
- 대개, 자유도가 30 이 넘으면 표준정규분포와 비슷하게 됨
3. t 분포의 확률변수의 변환
ㅇ t 분포의 확률변수 : T
- T : 모 평균 μ의 추정에 사용되는 추정 통계량
. 표준정규분포의 표준화 변량인 Z 처럼 표본평균({#\overline{X}#})을 선형변환한 것
ㅇ 변환식
[# T = \frac{\overline{X}-μ}{s/\sqrt{n}} #]
- n : 표본 수, (n-1) : 자유도, {#\overline{X}#} : 표본 평균, μ : 모 평균, s : 표본의 표준편차
ㅇ 한편, 모집단이 정규분포라고 가정하고,
- t 분포 확률변수를 표준정규분포 또는 카이제곱분포로써 표현하면,
[# T = \frac{(\overline{X}-μ)/(σ/n)}{\sqrt{s^2/σ^2}}
= \frac{Z}{\sqrt{V/(n-1)}} = \frac{Z}{\sqrt{V/r}} #]
. Z : 표준정규분포의 확률변수
. V : 자유도 r = (n-1) 인 카이제곱 분포의 확률변수
4. t 분포의 표기 및 형태
ㅇ 표기 : T ~ t(r)
- 여기서, r 은 양의 상수로써 자유도(표본의 수 - 1) 임
. t 분포는 단일한 분포라기 보다는,
. 자유도라는 모수에 따라 t₁,t₂,.... 등 무수히 많은 분포 군이 있음
ㅇ 형태
- 자유도가,
. 30 이하이면, 표준정규분포 보다 분산이 커져 보다 평평한 모양이 되고,
. 30 이 넘으면, 표준정규분포와 비슷하게 되고,
. 120 이상이 되면, 표준정규분포와 완전히 같아짐
5. t 분포의 확률적 특징
ㅇ t 분포의 확률밀도함수
ㅇ t 분포의 분산
- Var(T) = r/(r-2)
. 분산이 1 보다 큼
ㅇ t 분포의 평균
- E[T] = 0