통계/통계이론

Paired t-test의 이론적 이해

MKKM 2023. 4. 10. 01:45
반응형

Paired t-test란?

대응표본 t-test는 통계학에서 두 집단의 평균 차이를 검증하는 데 사용되는 방법입니다. 이 방법은 일치하는 관찰값이 있는 두 집단의 경우 효과적이며, 예를 들면, 실험 전후의 변화나 두 가지 상황에서 같은 개체에 대한 측정값을 비교할 때 사용됩니다.

 

독립 t-test와의 차이점

Paired t-test는 독립 t-test와 비슷한 방식으로 작동하지만, 일치하는 관찰값이 있는 두 집단에 대해 평균 차이를 검증하는 데 더 적합합니다. 독립 t-test는 서로 독립적인 두 집단의 평균 차이를 검증하는데 사용되는 방법입니다.

 

가정 및 조건

Paired t-test를 사용하기 위해서는 몇 가지 가정이 충족되어야 합니다. 이 가정들은 다음과 같습니다.

  • 정규성: 각 집단의 데이터가 정규 분포를 따른다는 가정이 필요합니다.
  • 독립성: 실험 전후의 차이에 대한 값들이 서로 독립적이어야 합니다.
  • 등분산성: 두 집단의 분산이 동일하다는 가정이 필요합니다.

 

Paired t-test의 예시

Paired t-test는 여러 가지 실용적인 상황에서 사용되며, 이러한 예시 중 하나는 의료 분야에서의 치료 효과 분석입니다. 새로운 치료법이 기존 치료법보다 나은지를 확인하기 위해 환자들의 치료 전후 건강 지표를 비교할 때 paired t-test를 사용할 수 있습니다. 또한, 교육 분야에서는 학습 방법의 효과를 평가하기 위해 학생들의 성적을 비교하는 데 활용됩니다.

 

의료 연구에서의 활용

의료 연구에서 paired t-test는 새로운 치료법이 기존 치료법에 비해 실질적으로 효과가 있는지를 확인하기 위해 사용됩니다. 예를 들어, 약물 A와 약물 B의 효과를 비교하기 위해 동일한 환자에게 약물 A와 약물 B를 차례로 투여한 후, 각각의 치료 효과를 비교할 때 paired t-test를 사용할 수 있습니다.

 

교육 연구에서의 활용

교육 연구에서는 학습 방법이 학생들의 성적에 어떤 영향을 미치는지 평가하기 위해 paired t-test를 사용할 수 있습니다. 예를 들어, 전통적인 강의 방식과 현대적인 온라인 학습 방식을 비교하여 어느 방식이 더 효과적인지를 알아보기 위해 동일한 학생들에게 두 가지 방식을 적용한 후, 성적을 비교하는데 paired t-test를 활용할 수 있습니다.

 

Paired t-test의 실행 과정

데이터 수집 및 정리

Paired t-test를 실행하기 전에 먼저 실험 전후의 데이터를 수집하고 정리해야 합니다. 이 과정에서는 관찰 대상들의 특성이나 실험 조건에 따른 변동을 최소화하기 위해 적절한 통계적 기법을 사용해야 합니다.

정규성 검정

데이터가 정규 분포를 따르는지 확인하기 위해 정규성 검정을 수행해야 합니다. 정규성을 검정하는 방법에는 Kolmogorov-Smirnov 검정, Shapiro-Wilk 검정 등이 있습니다. 이러한 검정을 통해 데이터가 정규 분포를 따르지 않는 경우, 비모수적 방법을 사용해야 합니다.

 

Paired t-test 계산법

t-값 계산

Paired t-test에서는 두 집단의 평균 차이를 표준 오차로 나눈 값을 t 값이라고 합니다. t 값은 다음과 같은 식으로 계산할 수 있습니다.

t = (M1 - M2) / (SD / √n)

여기서 M1과 M2는 각 집단의 평균, SD는 차이값들의 표준 편차, n은 샘플 크기를 의미합니다.

 

자유도와 t-분포표

Paired t-test에서는 자유도(degree of freedom)를 구해야 합니다. 자유도는 샘플 크기에서 1을 뺀 값으로 계산할 수 있습니다.

자유도 = n - 1

 

t 값과 자유도를 알고 있으면 t-분포표를 참조하여 p-value를 구할 수 있습니다. p-value는 귀무 가설이 참일 때 얻어진 결과보다 더 극단적인 결과를 얻을 확률을 나타냅니다.

 

결과 해석

유의성 검정

p-value가 미리 정한 유의 수준(예: 0.05)보다 작은 경우, 귀무 가설을 기각하고 대립 가설을 채택합니다. 즉, 두 집단의 평균 차이가 통계적으로 유의하다고 판단할 수 있습니다. 반대로 p-value가 유의 수준보다 큰 경우, 귀무 가설을 기각할 수 없으며 두 집단의 평균 차이가 통계적으로 유의하지 않다고 결론을 내립니다.

주의 사항

Paired t-test를 사용할 때는 다음과 같은 주의 사항을 고려해야 합니다.

  • 데이터가 정규 분포를 따르지 않는 경우, 비모수적 방법을 사용해야 합니다.
  • 독립성 가정이 위반된 경우, 결과 해석에 주의해야 합니다.
  • 표본 크기가 작은 경우, 검정력이 약할 수 있으므로 결과 해석에 주의해야 합니다.
반응형