반응형

크루스칼-왈리스 테스트는 세 개 이상의 독립 표본 그룹 간의 중앙값 차이를 검증하는 비모수 통계 검정입니다. R에서는 어떻게 이 검정을 수행하고 결과를 해석하는지 알아보겠습니다.

 

 

목차

  1. 크루스칼-왈리스 테스트 (Kruskal-Wallis Test) 이란
  2. R에서 크루스칼-왈리스 테스트 (Kruskal-Wallis Test)하는 법
  3. 분석결과 해석하는 법

 

1. 크루스칼-왈리스 테스트 (Kruskal-Wallis Test) 이란

크루스칼-왈리스 테스트는 세 개 이상의 독립 표본 그룹 간의 중앙값 차이를 검증하는 비모수 통계 검정입니다.
정규 분포나 분산의 동일성 가정을 만족하지 않는 데이터에 적합한 검정 방법으로, 각 데이터 포인트를 순위로 변환한 후 그룹 간의 순위 합의 차이를 바탕으로 통계적 유의성을 판단합니다.

 

2. R에서 크루스칼-왈리스 테스트 (Kruskal-Wallis Test)하는 법

R에서 크루스칼-왈리스 테스트를 수행하려면 kruskal.test() 함수를 사용합니다.
이 함수는 세 개 이상의 독립 표본 그룹을 입력으로 받아, 그룹 간의 중앙값 차이의 유의성을 평가하고 결과를 반환합니다.
이 함수의 반환 값에는 테스트 통계량과 p-값이 포함되어 있습니다.

 

예시 코드:

# 예시 데이터 생성
group1 <- rnorm(50, mean=10)
group2 <- rnorm(50, mean=12)
group3 <- rnorm(50, mean=11)

# 크루스칼-왈리스 테스트 수행
result <- kruskal.test(list(group1, group2, group3))
print(result)

위 코드는 'group1', 'group2', 'group3' 세 표본 그룹 간의 중앙값 차이의 유의성을 평가합니다.

 

3. 분석결과 해석하는 법

kruskal.test() 함수의 결과로 반환되는 주요 항목은 테스트 통계량과 p-값입니다.
p-값은 그룹 간의 중앙값 차이가 우연에 의한 것일 확률을 나타내며, 이 값이 작을수록 중앙값 간의 차이는 통계적으로 유의미하다는 것을 의미합니다.

 

예시 결과 해석:

# 예시 결과 출력
# 
#  Kruskal-Wallis rank sum test
# 
# data:  list(group1, group2, group3)
# Kruskal-Wallis chi-squared = 10.5, df = 2, p-value = 0.005

위 결과에서 p-값이 0.005로, 0.05보다 작으므로 세 그룹 간의 중앙값 차이는 통계적으로 유의미하다고 판단할 수 있습니다.

 

 

아래 포스팅도 참고해 보세요!

 R의 기본 개념, 예시코드와 알아보는 리스트(List)
 R에서 벡터 활용
 데이터 프레임의 열과 행 삭제하는 법
 RStudio 단축키 모음
 R에서 데이터 정렬하기
반응형
  • 네이버 블러그 공유하기
  • 네이버 밴드에 공유하기
  • 페이스북 공유하기
  • 카카오스토리 공유하기