통계적 추정
통계적 추정
표본의 특성을 나타내는 통계량을 기초로 하여 모집단의 특성인 모수를 추측하는 통계적 분석을 말한다.
점추정 | 모수를 단일치로 추측한다. 틀릴 가능성이 크며 신뢰도를 확률로 나타낼 수 없다. |
구간추정 | 모수를 포함할 것으로 예측되는 구간을 추측한다. 모수 추정치와 신뢰도를 확률로 구할 수 있다. |
점추정
모수의 점추정량은 다음과 같이 표본 통계량의 단일치로 추정한다.
(2) 모분산 ← 표본분산 (
(3) 모표준편차 ← 표본표준편차 (
표준오차 (Standard Error)
모평균(
표본평균이 모평균을 기준으로 얼마나 흩어져 있는 지를 나타낸다. 즉, 표본평균의 표준편차이다.
중심극한정리에 의해 표준오차는 다음식으로 표현된다.
신뢰수준 (Confidence Level)
구간추정 시 해당 구간 내에 추정하고자 하는 모수가 있을 확률이다. 신뢰수준 95%는 해당 모수를 100번 추정했을 때 신뢰구간 내에 95번 정도 포함된다는 의미이다. 일반적으로 90%, 95%, 99% 를 사용한다.
신뢰구간 (Confidence Interval)
해당 신뢰수준에서 모수가 포함될 구간을 말한다. 신뢰구간이 크면 모수의 추정범위가 커지므로 정보로서의 가치가 떨어진다.
신뢰수준이 정확성과 관련은 있으나 그 자체가 정확성을 나타내는 것은 아니다. 모수를 더 정확하게 추정하려면 신뢰구간의 폭을 줄이는 것이 필요하다. |
신뢰구간 추정
모수에 맞는 확률분포와 신뢰수준을 정하면 그에 해당하는 임계치가 정해진다. 확률분포는 평균이 0, 표준편차가 1로 맞추어져 있으므로 표본평균의 점추정량과 표준오차를 사용하여 임계치를 표본의 스케일로 변환해 준다.
모평균
[예제] 8 대의 A-엔진에 대한 실측 출력이 아래와 같을 때 전체 A-엔진 출력의 점추정치, 표준오차 및 구간 추정치(신뢰수준 95%)를 구하여라.
실측출력(PS) | 114.2 | 115.4 | 110.9 | 110.9 | 122.1 | 113.1 | 115.4 | 109.8 |
1) 점추정치 : 8 대 엔진의 출력평균
2) 표준오차 : 모표준편차를 모르므로 표본표준편차를 사용한다.
3) 구간추정치 : 데이터 개수가 8개(<30)이고 평균을 추정하는 것이므로 t-분포를 사용한다. 신뢰수준 95%의 t-분포 임계치는
표본 크기와 신뢰구간
신뢰구간의 범위 크기를 결정하는 것은 신뢰수준과 표본오차이지만, 일반적으로 신뢰수준은 정해진 값을 사용하므로, 신뢰구간에 실질적으로 영향을 주는 것은 표준오차라고 할 수 있다.
중심극한정리에 의해 표준오차는
신뢰구간의 결정
댓글
댓글 쓰기