점추정(Point Estimation)
모집단의 특성인 모평균, 모표준편차, 모비율 등을 표본을 이용하여 하나의 값으로 예측
모평균(모분산, 모비율)의 추정량 중 불편추정량이면서 분산이 가장 작은 추정량은 표본평균(표본분산, 표본비율)
모수 | 추정량 |
모평균$(\mu)$ | $\bar X = \frac{1}{n}\sum X_i$ |
모분산$\sigma^2$ | $S^2 = \frac{1}{n - 1}\sum (X_i -\bar X)^2$ |
모비율(p) | $\hat{p} = \frac{X}{n}$ |
통계량
표본평균$\bar X = \frac{1}{n} \sum X_i\sim N(\mu, \frac{\sigma^2}{n})$
표본분산$S^2 = \frac{1}{n - 1}\sum (X_i - \bar X)^2$
표본비율$\hat{p} = \frac{X}{n}\sim B(n, p)$
자유도$\frac{(n -1)S^2}{\sigma^2} \sim X^2(n - 1)$
좋은 추정량의 기준
불편성(unbiasedness) 편중되지 않았다. 오차가 적다는 뜻 $E(\hat{\theta}) = \theta $
유효성 분산이 더 작은 추정량
일치성 표본의 크기가 커짐에 따라 불편추정량에 가까워진다.$E(\hat{\theta}) = \frac{n - 1}{n}\theta \to \theta$
표본분산의 분모가 n -1인 이유
표본분산의 모분산$(\sigma^2)$의 불편추정량이 되도록 하기 위해,$E(S^2) = \sigma^2$
점 추정량 구하는 방법
1. 적률법 $E(X^k) = \frac{1}{n}\sum X^k_i, k = 1,2,...,n$
2. 최대우도추정법 우도함수 $f(x_1, x_2, ..., x_n; \theta$를 최대로 하는 추정값
구간추정
점추정은 한 통계량 값으로 모수의 값을 추정하는 방법인데, 표본오차 만큼의 오차 범위 발생한다. 표본오차 만큼의 범위를 감안하여 모수를 포함할 구간으로 추정하는 것을 구간추정이라고 한다.
모분산 $\sigma^2$을 아는 경우
확률표본 $\bar X \sim N(\mu, \frac{\sigma^2}{n})$, 표준화 $\frac{\bar X - \mu}{\sigma / \sqrt(n)} \sim N(0, 1)$
모비율
모비율의 추정량 = $ \hat p = \frac{X}{n}$
추정량의 표준오차 = $\sqrt \frac{\hat p(1- \hat p)}{n}$
신뢰도 95%의 오차한계 = $1.96 * \sqrt \frac{\hat p(1- \hat p)}{n}$
신뢰도 95% 신뢰구간 = $1.96 * \sqrt \frac{\hat p(1- \hat p)}{n}$
모비율 추정에서의 표본 크기
모비율 p의 신뢰도 95% 신뢰구간 = $\hat p - 1.96*\sqrt \frac{\hat p(1-p)}{n}, \hat p + 1.96*\sqrt \frac{\hat p(1-p)}{n}$
최대허용 표본오차 =$1.96*\sqrt \frac{1}{4n}$
오차의 한계를 d 이하로 하려면 표본의 크기는 = $n > \frac{1}{4}*(\frac{1.96}{d})^2$
모평균 추정에서 표본 크기
모평균$\mu$의 신뢰도 95%구간 $\bar X - 1.96 *\frac{\sigma}{\sqrt n}, \bar X + 1.96 *\frac{\sigma}{\sqrt n}$
오차 = $1.96*\frac{\sigma}{\sqrt n}$
오차의 한계를 d이하로 하려면 표본의 크기는 = $n > (1.96*\frac{\sigma}{d})^2$
'전산통계 > 강의노트' 카테고리의 다른 글
chapter10 - 상관분석과 회귀분석 (0) | 2023.06.05 |
---|---|
chapter9 - 범주형 자료분석(교차분석) (0) | 2023.06.04 |
chapter 8 - 분산분석 (0) | 2023.06.03 |
chapter 7 - 가설검정 (0) | 2023.06.03 |