1. 구간 추정 (Interval Estimation)
ㅇ 미리 정해진 확신(`신뢰 수준`)으로,
- 모수(참값)가 포함되리라고 여겨지는,
- `신뢰 구간`을 추정하는, 통계적 추정 방법 (Confidence Interval Estimation)
* 여기서,
. 신뢰 수준 => 확률 값
. 신뢰 구간 => 모수 포함 기대(추정) 구간
2. 신뢰 수준 (Confidence Level) : 확률값 임
ㅇ 미지의 모수가, 신뢰상한 ~ 신뢰하한 사이 (신뢰구간 내)에 있으리라고 확신하는 확률
- 즉, 모수(참값)가 추정한 구간 내 포함되리라고 확신하는/신뢰할 수 있는 확률 수준 값
ㅇ 보통, 사용되는 신뢰수준 값 : 95%, 99% 등을 사용 (통상 95% 수준을 많이 사용하는 편)
- 이 수준값은 연구수행자가 직접 설정하게 됨
ㅇ 한편, 오차율(오차범위)에 의한 신뢰수준 표현 : 1 - α 또는 (1-α)100%
- ( α : α 오차 (1종 과오), 1 - α : 1종 과오를 범하지 않을 확률 즉, 신뢰수준)
[# P(\hat{θ}_L \leq θ \leq \hat{θ}_U) = 1 - α #]
ㅇ (명칭) 신뢰수준 / 신뢰율 / 신뢰계수
- (Confidence Level / Degree of Confidence / Confidence Coefficient)
3. 신뢰 구간 (Confidence Interval) : 구간 추정 例)
ㅇ 例) 정규분포를 따르고 모 분산(표준편차 σ)를 아는 경우,
- 95% 신뢰수준에서, 표본 평균에 의한 모 평균의 신뢰구간 계산식 ☞ 신뢰구간 설정 참조
. P ( μ - 1.96 σ/√n ≤ X̅ ≤ μ + 1.96 σ/√n ) = 95%
.. (μ : 모 평균, σ/√n : 표본오차, σ : 표준편차, n : 표본 크기, X̅ : 표본평균)
- 즉, 95% 신뢰수준 하에, n개 표본의 표본평균이 모수(모 평균)를 포함하는 기대 구간은?
. (μ - 1.96 σ/√n) 이상, (μ + 1.96 σ/√n) 이하 임
. 또는, - 1.96 ≤ (X̅ - μ)/(σ/√n) ≤ + 1.96 임
* 단, 관측 데이터(표본 크기 n)가 많을수록, 모수 포함 기대 구간은 좁아짐
4. 모수의 포함에 대한 척도들 : 신뢰수준을 만족하는 구간 (신뢰구간, 신뢰한계, 신뢰구간 길이)
ㅇ 신뢰 구간 (Confidence Interval)
- 일정한 신뢰수준으로 모수가 포함되리라고 기대되는 구간 : {#[\hat{θ}_L,\hat{θ}_U]#}
ㅇ 신뢰 한계 (Confidence Limits) : {#\hat{θ}_L#}, {#\hat{θ}_U#}
- 상하한 값이 있음
. 신뢰하한(Lower Confidence Limit) : θL^
. 신뢰상한(Upper Confidence Limit) : θU^
- 신뢰한계 안에 모수가 포함될 확률이 신뢰수준 임
ㅇ 신뢰 구간 길이 (Confidence Interval Length) : {#\hat{θ}_U - \hat{θ}_L#}
- 신뢰구간 길이가 짧을수록 좋음
. 그 이유는 모수의 위치 정보가 더 정확하기 때문
5. 모수의 벗어남에 대한 척도들 : 오차의 한계, 오차율
ㅇ 오차의 한계 (margin of error)
- 신뢰구간의 길이({#\hat{θ}_U - \hat{θ}_L#})를 결정짓는 값
. 모 분산 또는 모 표준편차를 알고 있을 때 : [# Z_{α/2} \frac{σ}{\sqrt{n}}#]
ㅇ 오차율 (probability of error) : α
- 모수(참값)가 신뢰구간에 포함되지 않을 확률 (1종 과오를 범할 확률)
. 보통 0.1%, 0.05%, 0.01% 등을 사용 (통상 0.05% 를 많이 사용하는 편)
- 오차율을 가설검정에서는 유의수준 이라고 함
6. [추가 검토사항]
ㅇ 신뢰구간 {#[\hat{θ}_L,\hat{θ}_U]#}을 얻는 방법 ☞ 신뢰구간 설정 참조
- 모 평균의 신뢰구간, 모 분산의 신뢰구간, 모 비율의 신뢰구간
ㅇ 표본 크기의 결정