모분산
모집단의 흩어져있는 정도를 나타내는 양
점추정
$$\hat{\sigma}^2 = S^2 = \textstyle\sum_{1=1}^2(X_i-\bar{X})^2/(n-1)$$
$$\hat{\sigma}^2 = \sqrt{S^2} = S$$
구간추정
정규모집단 $$ N(\mu, \sigma^2)$$의 분산 $$ \sigma^2$$에 대한 구간 추정은 다음과 같은 통계량에 기초한다.
$$(n-1)S^2/\sigma^2~x^2(n-1)$$
분산에 대한 100(1-α)%의 신뢰구간
$${\frac{(n-1)S^2}{X^2_{{a/2}^{(n-1)}}},\frac{(n-1)S^2}{X^2_{1-\frac{a}{2}^{(n-1)}}}}$$
신뢰구간의 예
어느 공정에서 생산되는 강철판 두께의 산포는 어느 정도는 필연적인 것으로 간주되지만, 두께의 표준편차가 1.2mm를 넘으면 생산공정에 이상이 있는 것으로 간주한다. 그래서 10개의 판을 랜덤 추출하여 두께를 측정한 결과(단위:mm)는 다음과 같았다.
23,22,24,25,23,22,24,26,23
강철판의 두께의 분포가 정규분포라고 할 때, 판 두께의 모분산에 대한 90% 신뢰구간을 구하여라.
$$n=10, S^2=1.8222, S=1.3499$$
$$X^2_{0.05}(9) = 16.919, X^2_{0.95}(9) = 3.325$$
따라서 90% 신뢰구간은
$$(\frac{9*1.8222}{16.919},\frac{9*18222}{3.325})=(0.9693,4.9323)$$
가설검정
표준편차가 σ인 정규모집단으로부터 추출한 X1,X2,...Xn의 σ추정량
$$ s=\sqrt{\frac{\sum{(X_i-\bar{X})^2}}{n-1} }$$
가설 H0 : σ = σ0에 대한 검정 :
$$검정 통계량 : X^2 = \frac{(n-1)S^2}{\sigma_0^2}$$
$$이 검정 통계량의 관측값 : X_0^2$$
가설
$$(1) H_0 : \sigma = \sigma_0 \enspace \enspace H_1: \sigma > \sigma_0$$
$$R : X^2_0 \geq X^2_{\alpha}(n-1)이면 \enspace H_0를 \enspace 기각$$
$$유의확률 : P(X^2 \geq X^2_0) $$
$$(2) H_0 : \sigma = \sigma_0 \enspace \enspace H_1: \sigma < \sigma_0$$
$$R : X^2_0 \leq X^2_{1-\alpha}(n-1)이면 \enspace H_0를 \enspace 기각$$
$$유의확률 : P(X^2 \leq X^2_0) $$
$$(3) H_0 : \sigma = \sigma_0 \enspace \enspace H_1: \sigma \not = \sigma_0$$
$$R : X^2_0 \leq X^2_{\alpha/2}(n-1) \enspace혹은\enspace X^2_0 \geq X^2_{1-\alpha/2}이면 \enspace H_0를 \enspace 기각$$
$$유의확률 : 2P(X^2 \leq X^2_0) \enspace혹은\enspace 2P(X^2 \geq X^2_0)$$
가설 검정의 예
볼트와 너트를 생산하는 한 공장에서 제품의 품질이 얼마나 균일하게 유지되는지를 검사하려고 10개의 볼트를 추출하여 지름을 측정하고 그 표준편차를 구하였더니 0.4였다. 그 공장에서 생산되는 볼트의 지름이 정규분포를 따른다는 가정 하에 σ가 0.2보다 크다고 할 수 있는 유의수준 0.05로 검정하여라.
$$H_0 = 0.2 \enspace VS H_1 : \sigma > 0.2 $$
$$표본의\enspace 크기가\enspace10이고,\enspace \sigma_0 = 0.2,\enspace s=0.4이므로\enspace 검정통계량의 \enspace 관측값은 \enspace X^2_0=36이다.$$
$$기각역 : X^2_0 \geq X^2_{0.05})9)=16.92$$이고
검정통계량의 관측값이 기각역에 포함되므로 귀무가설을 기각할 수 있다.
이표본에 의한 분산비 검정
신뢰구간과 가설검정의 예
A,B 두 기계에서 생산되는 제품(볼트)의 무게에 대한 균등성을 비교하려고 한다.
두 기계에서 나온 제품을 랜덤하게 추출하여 그 무게를 측정한 결과 다음과 같은 자료를 얻었다.
-기계 A : 표본크기 nA = 13 ,표본 표분편차 SA=2.3
-기계 B : 표본크기 nB = 11 ,표본 표분편차 SB=1.5
1)기계 A의 변이도가 기계B의 변이도보다 크다고 할 수 있는지 유의수준 5%에서 검정하여라.
2)두 모분산의 비에 대한 90% 신뢰구간을 구하여라.
가설
$$H_0 : \frac{\sigma^2_1}{\sigma^2_2} =1 \enspace VS H_1:\frac{\sigma^2_1}{\sigma^2_2}$$
$$(1) f = s^2_A/s^2_B = \frac{5.29}{2.25} = 2.35$$
$$유의수준\enspace 5%에서의 \enspace 기각역 - R: f > F(12,10;0.15) = 2.91$$
이는 기각역에 포함되지 않으므로 귀무가설을 기각할 수 없다. 죽, 기계A의 변이도가 기계B의 변이도보다 크다는 확증은 없다.
$$(2)\frac{s^2_A}{s^2_B}\frac{1}{F(12,10;0.05)} \leq \frac{\sigma^2_A}{\sigma^2_B} \leq \frac{s^2_A}{s^2_B}\frac{1}{F(12,10;0.05)} = (0.807, 6.470) $$