Hodustory/프로그래밍&DB

[데이터분석 공부6일차] 모분산을 이용한 가설검정

호두밥 2019. 7. 6. 22:22

모분산

모집단의 흩어져있는 정도를 나타내는 양

 

점추정

$$\hat{\sigma}^2 = S^2 = \textstyle\sum_{1=1}^2(X_i-\bar{X})^2/(n-1)$$

$$\hat{\sigma}^2 = \sqrt{S^2} = S$$

 

구간추정

정규모집단 $$ N(\mu, \sigma^2)$$의 분산 $$ \sigma^2$$에 대한 구간 추정은 다음과 같은 통계량에 기초한다.

$$(n-1)S^2/\sigma^2~x^2(n-1)$$

분산에 대한 100(1-α)%의 신뢰구간

$${\frac{(n-1)S^2}{X^2_{{a/2}^{(n-1)}}},\frac{(n-1)S^2}{X^2_{1-\frac{a}{2}^{(n-1)}}}}$$

 

신뢰구간의 예

어느 공정에서 생산되는 강철판 두께의 산포는 어느 정도는 필연적인 것으로 간주되지만, 두께의 표준편차가 1.2mm를 넘으면 생산공정에 이상이 있는 것으로 간주한다. 그래서 10개의 판을 랜덤 추출하여 두께를 측정한 결과(단위:mm)는 다음과 같았다.

23,22,24,25,23,22,24,26,23

강철판의 두께의 분포가 정규분포라고 할 때, 판 두께의 모분산에 대한 90% 신뢰구간을 구하여라.

$$n=10, S^2=1.8222, S=1.3499$$

$$X^2_{0.05}(9) = 16.919, X^2_{0.95}(9) = 3.325$$

따라서 90% 신뢰구간은 

$$(\frac{9*1.8222}{16.919},\frac{9*18222}{3.325})=(0.9693,4.9323)$$

 

가설검정

표준편차가 σ인 정규모집단으로부터 추출한 X1,X2,...Xn의 σ추정량

$$ s=\sqrt{\frac{\sum{(X_i-\bar{X})^2}}{n-1} }$$

가설 H0 : σσ0에 대한 검정 : 

$$검정 통계량 : X^2 = \frac{(n-1)S^2}{\sigma_0^2}$$

$$이 검정 통계량의 관측값 : X_0^2$$

 

가설

$$(1) H_0 : \sigma = \sigma_0 \enspace \enspace H_1: \sigma > \sigma_0$$

$$R : X^2_0 \geq X^2_{\alpha}(n-1)이면 \enspace H_0를 \enspace 기각$$

$$유의확률 : P(X^2 \geq X^2_0) $$

 

$$(2) H_0 : \sigma = \sigma_0 \enspace \enspace H_1: \sigma < \sigma_0$$

$$R : X^2_0 \leq X^2_{1-\alpha}(n-1)이면 \enspace H_0를 \enspace 기각$$

$$유의확률 : P(X^2 \leq X^2_0) $$

 

$$(3) H_0 : \sigma = \sigma_0 \enspace \enspace H_1: \sigma \not = \sigma_0$$

$$R : X^2_0 \leq X^2_{\alpha/2}(n-1) \enspace혹은\enspace X^2_0 \geq X^2_{1-\alpha/2}이면 \enspace H_0를 \enspace 기각$$

$$유의확률 : 2P(X^2 \leq X^2_0) \enspace혹은\enspace 2P(X^2 \geq X^2_0)$$

 

가설 검정의 예

볼트와 너트를 생산하는 한 공장에서 제품의 품질이 얼마나 균일하게 유지되는지를 검사하려고 10개의 볼트를 추출하여 지름을 측정하고 그 표준편차를 구하였더니 0.4였다. 그 공장에서 생산되는 볼트의 지름이 정규분포를 따른다는 가정 하에 σ가 0.2보다 크다고 할 수 있는 유의수준 0.05로 검정하여라. 

 

$$H_0 = 0.2 \enspace VS H_1 : \sigma > 0.2 $$

$$표본의\enspace 크기가\enspace10이고,\enspace \sigma_0 = 0.2,\enspace s=0.4이므로\enspace 검정통계량의 \enspace 관측값은 \enspace X^2_0=36이다.$$

$$기각역 : X^2_0 \geq X^2_{0.05})9)=16.92$$이고

검정통계량의 관측값이 기각역에 포함되므로 귀무가설을 기각할 수 있다.

 

이표본에 의한 분산비 검정

 

신뢰구간과 가설검정의 예

A,B 두 기계에서 생산되는 제품(볼트)의 무게에 대한 균등성을 비교하려고 한다. 

두 기계에서 나온 제품을 랜덤하게 추출하여 그 무게를 측정한 결과 다음과 같은 자료를 얻었다.

 

-기계 A : 표본크기 nA = 13 ,표본 표분편차 SA=2.3

-기계 B : 표본크기 nB = 11 ,표본 표분편차 SB=1.5

 

1)기계 A의 변이도가 기계B의 변이도보다 크다고 할 수 있는지 유의수준 5%에서 검정하여라.

2)두 모분산의 비에 대한 90% 신뢰구간을 구하여라.

가설 

$$H_0 : \frac{\sigma^2_1}{\sigma^2_2} =1 \enspace VS H_1:\frac{\sigma^2_1}{\sigma^2_2}$$

 

$$(1) f = s^2_A/s^2_B = \frac{5.29}{2.25} = 2.35$$

$$유의수준\enspace 5%에서의 \enspace 기각역 - R: f > F(12,10;0.15) = 2.91$$

이는 기각역에 포함되지 않으므로 귀무가설을 기각할 수 없다. 죽, 기계A의 변이도가 기계B의 변이도보다 크다는 확증은 없다.

 

$$(2)\frac{s^2_A}{s^2_B}\frac{1}{F(12,10;0.05)} \leq \frac{\sigma^2_A}{\sigma^2_B} \leq \frac{s^2_A}{s^2_B}\frac{1}{F(12,10;0.05)} = (0.807, 6.470) $$

 

 

 

반응형