본문 바로가기
통계_수학/통계_EXCEL.SPSS.R로 배우는 통계학 입문

[통계/기초] #9 검정

by yj-data 2025. 5. 12.

0. 추정과 가설검정
1. 가설검정의 요소들
2. 모평균 μ에 대한 검정: σ 를 아는 경우
3. 모평균 μ에 대한 검정: σ 를 모르는 경우
4. 모평균 μ에 대한 검정: 대표본조사
5. 모비율 p에 대한 검정

0. 추정과 가설검정

  • 가설검정(hypothesis testing)은 모집단의 어떤 현상에 대한 예상 or 주장을 옳은지 틀린지를 판단하는 것이다. 이는 표본자료를 이용하여 진행한다.
  • 따라서 가설검정은 주어진 가설을 확증하는 확증적 자료분석이다.

<<가설검정의 단계>>

  1. 가설(모집단의 특성에 대한 주장)을 설정한다.
  2. 검정의 유의수준 $\alpha$를 정한다
  3. 표본을 추출하여 검정통계량을 계산한다.
  4. 검정통계량에 대한 p값을 구하여 가설에 대한 결론을 내린다(or 기각역에 속하는지 검토해 결론을 내린다)

1. 가설검정의 요소들

<<개념 톺아보기>>

  1. 통계적 가설은 귀무가설과 대립가설에 대해 통계적으로 다루기에 편리하도록 정리해놓은 것.
  2. 귀무가설($H_{0}$, 영 가설): 일반적으로 과거 이론이나 경험적으로 참이라고 믿어지지만 검정되어야 하는 가설.
  3. 대립가설($H_{1}$ or$H_{a}$, 연구 가설): 귀무가설이 참이 아닌 경우, 참이라고 믿어지는 가설.
    => 검정통계량이 귀무가설을 뒷받침하지 못하면 귀무가설을 기각한다. 강한 증거가 제시되지 않는 경우 귀무가설을 기각할 수 없다.
    (예, 귀무가설: 피고는 무죄이다 / 대립가설: 피고는 유죄이다 => 유죄 쪽으로 강한 근거가 제시되어야지만 귀무가설을 기각할 수 있음)

대립가설 종류 3가지

귀무가설/대립가설 세우기

1) 귀무가설 = k, 대립가설 $\neq$ k => 양측검정
2) 귀무가설 = k, 대립가설 < k (or 대립가설 > k) => 단측검정
* 대립가설의 방향은 귀무가설을 기각할 수 있는 검정통계량의 방향을 제시해줌!!

  1. 검정통계량: 검정에 사용하기 위해 표본에서 구한 통계량
  • 검정하려는 모수의 점추정량이 되거나, 점추정량을 표준화 한 것을 사용하기도 함.

검정모수와 검정통계량
검정하려는 모수($\mu$) - $\sigma$를 알때 - $Z = \frac{\overline{X}-\mu_{0}}{\sigma/\sqrt{n}} ~ N(0,1)$
검정하려는 모수($\mu$) - $\sigma$를 모를때 - $t = \frac{\overline{X}-\mu_{0}}{s/\sqrt{n}} ~ t(n-1)$
검정하려는 모수(p) - $np \geq 5 이며, n(1-p) \geq 5$ - $Z = \frac{\overline{p}-p_{0}}{\sqrt{p_{0}(1-p_{0})/n}} ~ N(0,1)$
정규모집단이 아닌 경우 - 표본수를 충분히하여(>= 30) 근사적으로 중심극한정리에 의한 검정통계량을 구할 수 있음

  1. 검정오류
  • 가설의 검정은 '정도의 문제'다. 이다, 아니다의 문제가 아님!
  • 따라서 가설이 맞다, 틀리다가 아니라 '가설이 틀리다고 할만한 강력한 증거가 없다'로 결론이 남.
    => 이 이유는 통계적 검증은 확률적으로 나타나는 표본에 근거를 두고 판단하므로, 그 결론도 확률적일 수 밖에 없기 때문!!
  • 결국, 귀무가설이 틀릴 가능성이 높으면 > 귀무가설 기각 // 아니면 기각하지 못함 => 통계학에서는 맞을 가능성 보다는 틀릴 가능성(=>검정오류 test error)에 대해 논함.

제 1종 오류

  • 귀무가설이 맞는데 잘못해서 기각하여 발생하는 오류
  • 제 1종 오류가 발생할 확률을 $\alpha$로 표기하고, 검정의 유의수준(significance level) 이라 부름
  • $\alpha = Pr{제1종오류} = Pr{H_{0} 기각 | H_{0} 사실}$

제 2종 오류

  • 대립가설이 사실임에도 귀무가설을 기각하지 못하는 오류
  • 제 2종 오류가 발생할 확률을 $\beta$로 표기
  • $\beta = Pr{제2종오류} = Pr{H_{0} 기각못함 | H_{a} 사실}$
  • 단, 대립가설은 모수의 영역으로 표현되므로, $H_{a}$가 사실일 때 모수값이 한개 값으로 주어지지 않음. 따라서 대립가설의 영역에서 대표적인 or 관심있는 모수 값을 정하여 제 2종 오류를 살펴볼 수 있음.
  1. 검정력: 가설검정의 결과가 올바른 결정이 될 확률
  • 검정력: 대립가설이 사실일 때, 귀무가설을 기각할 확률(1-$\beta$)
  • 귀무가설이 사실일 때, 이를 기각하지 못하는 확률: 1-$\alpha$
  • 가설의 검정에서는 두 검정오류를 최소화 하려고 노력. 단, 하나를 작게하려다 다른게 커지는 모순이 있음.
    => 실제로는 주어진 $\alpha$를 고정시키고, 이를 만족시키는 기각역 중에 $\beta$를 최소로 하는 기각역을 택함.
  • 가설 검정에 영향을 미치는 추가 변수: 표본수 => 표본수가 커지만 분산이 작아져서, 고정된 $\alpha$에 대하여 $\beta$가 작아짐
  • 유의수준 $\alpha$ 정하기: 일반적으로 해당 학문 세계에서 사용하는 유의수준을 활용하면 되나, 정보가 없는 경우 관습적으로 $\alpha$=0.05를 가장 많이 사용함. 게다가 0.05보다 작은 값은 있어도, 이보다 큰 값을 활용한 논문은 없음.
    • 사회과학 분야는 0.05, 자연과학분야는 0.01, 0.001을 많이 사용함

<<정리>>

  • 귀무가설 - 사실 -> 귀무가설 기각 불가: 1-$\alpha$ (올바른결정)
  • 귀무가설 - 사실 -> 귀무가설 기각: $\alpha$ - 제 1종 오류(유의수준)
    귀무가설 - 거짓 -> 귀무가설 기각 불가: $\beta$ - 제 2종 오류
    귀무가설 - 거짓 -> 귀무가설 기각 불가: 1-$\beta$ (올바른결정, 검정력)
  1. p값(관측유의수준)과 기각역
  • p값(p-value)은 귀무가설이 사실이라는 전제하에, 표본에서 실제로 관측된 통계치와 같거나 (대립가설 방향으로) 더 극단적인 통계치가 관측될 확률
  • 따라서, p값이 작다 = 귀무가설이 참일 때 나오기 힘든 경우가 나온 것 => 귀무가설을 기각하는 쪽으로 신뢰를 갖게 함
  • p값 $\geq \alpha$ 이면, 귀무가설 기각 못함 // p값 < $\alpha$ 면, 귀무가설 기각
  • p값 계산: 표본조사 결과 k=0.4로 나옴, 대립가설이 p<0.5일 경우, p는 표본비율이 0.4보다 작을 확률 or 대립가설이 p $\neq$ 0.5 일 경우, 표본비율이 0.4보다 작거나 0.6보다 클 확률을 더한 값

 

 

  • 기각역: 귀무가설이 사실이 아니라고 기각하게 되는 검정통계량의 영역
    • 기각역을 먼저 정해놓고 표본에 의한 값이 이 기각역에 속하는지 판정하게 됨
    • 유의 수준에 따라 기각역을 정하고, 검저옹계량 값이 기각역에 속하면 귀무가설을 기각한다.

2. 모평균 $\mu$에 대한 검정: $\sigma$를 아는 경우

  • $Z = \frac{\overline{X}-\mu_{0}}{\sigma/\sqrt{n}}$ => 표준정규분포를 따름 (여기서 $\mu_{0}$는 $H_{0}$의 평균)
  • 모집단이 정규분포를 따르지 않아도, 표본수가 충분히 크면 근사적으로 위의 검정통계량 사용 가능

단측검정

  • 아래꼬리 검정: 귀무가설: $\mu = \mu_{0}$, 대립가설: $\mu < \mu_{0}$ (좌측 꼬리)
  • 위꼬리 검정: 귀무가설: $\mu = \mu_{0}$, 대립가설: $\mu > \mu_{0}$ (우측 꼬리)

예를 보면서 이해해보자
- 문제: 한국 청소년의 하루 평균 OTT 시청시간에 대해 가설검정을 한다. 한편은 3시간이라 주장하고, 한편은 3시간이 안될것이라 주장함. 조사 대상은 100명의 청소년. $\overline{x} = 2.75$ 시간으로 나왔음.($\sigma=1$이라 가정)
- 가설은 - 귀무가설: $\mu = 3.0$ // 대립가설: $\mu < 3.0$
- 검정통계는 - $z = \frac{\overline{X}-\mu_{0}}{\sigma/\sqrt{n}}$ = (2.75-3) / 1/루트100 = -2.5
- p값 = Pr(Z<-2.5) = 0.0062 => p는 0.05(유의수준)보다 작으므로 귀무가설은 기각됨
- 기각역 - 단측검정 유의수준 0.05인 경우, 표준정규분포표에서 아래꼬리 확률이 0.05가 되는 z값은 -1.645다. 여기서 기각역은 $(-\infty, -1.645)$. 검정통계량 z가 -1.645보다 작으면 귀무가설을 기각한다는 뜻.

양측검정

  • 귀무가설: $\mu = \mu_{0}$, 대립가설: $\mu \neq \mu_{0}$ >> 이 경우, $\overline{x}$가 $\mu_{0}$에 비해 아주 크거나 작으면, $\overline{x}$는 $\mu_{0}$가 아닌 다른 값을 평균으로 갖는 분포에서 나왔다고 할 수 있음. 따라서 귀무가설을 뒷받침하기 힘든 상황이 되는 것.

다시 예시를 활용해보자.
- p값= Pr(Z<-2.5) + Pr(Z>2.5) = 0.0124
- 기각역 - 양측검정 유의수준 0.05 이므로, z<-1.96 과 z>1.96 >> z=-2.5는 기각역에 속함. 따라서 귀무가설을 기각함.

정리

출처: excel.spss.r로 배우는 통계학 입문 제 3판 p314

가설검정의 순서

  1. 귀무가설과 대립가설을 설정한다.
  2. 주어진 문제의 특성에 따라 유의수준을 결정한다.
  3. 표본자료를 이용하여 검정통계량을 계산한다.

=> p값 사용
4. 검정통계를 사용하여 p값을 구한다.
5. p값 $\leq \alpha$ 이면 귀무가설을 기각한다.

 

=> 기각역 사용
4. 유의수준에 따라 기각역을 구한다.
5. 검정통계가 기각역에 속하면 귀무가설을 기각한다.

3. 모평균 $\mu$에 대한 검정: $\sigma$를 모르는 경우

  • $\sigma$ 대신 추정량 S를 사용하고, Z대신 t분포 값을 검정통계량으로 사용함. 자유도는 n-1.
  • $t = \frac{\overline{X}-\mu_{0}}{S/\sqrt{n}}$

단측검정

  • 예시로 알아보자.
  • 출근시간대에 강남에서 용산까지 차로 출근할 때 걸리는 시간에 관해, 어떤 사람이 1시간 이상 걸린다고 주장을 했다.
  • 가설 - 귀무가설: $\mu$ = 60, 대립가설: $\mu$ > 60
  • 9일동안 출근시간 시험 결과: $\overline{x}=65(분), s=10(분)$
  • 검정통계는 $t = \frac{\overline{X}-\mu_{0}}{S/\sqrt{n}}$ = 65-60 / 10/루트9 = 1.5
  • 자유도가 8일때, t분포표에서 1.5는 .10과 .05사이에 위치함. 따라서, p값이 0.05~0.10사이에 있음. => p값이 $\alpha$보다 커져서, 귀무가설을 기각할 수 없음.
  • 기각역(자유도8): t>1.860

양측검정

  • 가설 - 귀무가설: $\mu$ = 60, 대립가설: $\mu \neq 60$
  • p값 - 단측검정의 두배, 즉 0.1과 0.2사이. 0.05보다 크므로 기각하지 못하게 됨
  • 기각역(자유도8) = $t_{0.025}$ = 2.306 >> t<-2.306 or t>2.306

요약

출처: excel.spss.r로 배우는 통계학 입문 제 3판 p319

4. 모평균 $\mu$에 대한 검정: 대표본조사

  • 모집단이 정규분포를 하지 않아도 표본수가 많은 경우, \frac{\overline{X}-\mu_{0}}{\sigma/\sqrt{n}}는 근사적으로 정규분포를 따른다. $\sigma$를 몰라서, 표본에서 구한 s로 대체하여도 표본수가 많으면 근사적으로 표준정규분포를 따른다.(모집단이 정규분포를 하지않고, 표본수도 적은 경우는 비모수방법(17장), 정확검정 등을 이용하여야 한다)
  • 모집단의 크기에 대한 논란은 있지만, 전반적으로 30개 이상은 인정된다. 모집단이 정규분포에 가까운 대칭인 경우, 더 작은 수도 가능하다. 비대칭이 심한 경우는 50,100개 정도를 사용하기도 한다.
  • 실제 통계분석을 할때, 비용과 시간이 허락하는 한 충분히 많은 표본이 필요하며, 작은 표본을 사용해야 하는 경우는 정규분포로의 근사에 대한 타당성에 대한 검토가 필요할 수 있다.

5. 모비율 p에 대한 검정

앞선 단원에서와 같이, 비율은 평균과 유사하다.

 

요약

출처: excel.spss.r로 배우는 통계학 입문 제 3판 p322