통계/R
R 프로그래밍에서 크루스칼-왈리스 검정으로 데이터 분석하기
MKKM
2023. 10. 11. 21:07
반응형
크루스칼-왈리스 테스트는 세 개 이상의 독립 표본 그룹 간의 중앙값 차이를 검증하는 비모수 통계 검정입니다. R에서는 어떻게 이 검정을 수행하고 결과를 해석하는지 알아보겠습니다.
목차
1. 크루스칼-왈리스 테스트 (Kruskal-Wallis Test) 이란
크루스칼-왈리스 테스트는 세 개 이상의 독립 표본 그룹 간의 중앙값 차이를 검증하는 비모수 통계 검정입니다.
정규 분포나 분산의 동일성 가정을 만족하지 않는 데이터에 적합한 검정 방법으로, 각 데이터 포인트를 순위로 변환한 후 그룹 간의 순위 합의 차이를 바탕으로 통계적 유의성을 판단합니다.
2. R에서 크루스칼-왈리스 테스트 (Kruskal-Wallis Test)하는 법
R에서 크루스칼-왈리스 테스트를 수행하려면 kruskal.test()
함수를 사용합니다.
이 함수는 세 개 이상의 독립 표본 그룹을 입력으로 받아, 그룹 간의 중앙값 차이의 유의성을 평가하고 결과를 반환합니다.
이 함수의 반환 값에는 테스트 통계량과 p-값이 포함되어 있습니다.
예시 코드:
# 예시 데이터 생성
group1 <- rnorm(50, mean=10)
group2 <- rnorm(50, mean=12)
group3 <- rnorm(50, mean=11)
# 크루스칼-왈리스 테스트 수행
result <- kruskal.test(list(group1, group2, group3))
print(result)
위 코드는 'group1', 'group2', 'group3' 세 표본 그룹 간의 중앙값 차이의 유의성을 평가합니다.
3. 분석결과 해석하는 법
kruskal.test()
함수의 결과로 반환되는 주요 항목은 테스트 통계량과 p-값입니다.
p-값은 그룹 간의 중앙값 차이가 우연에 의한 것일 확률을 나타내며, 이 값이 작을수록 중앙값 간의 차이는 통계적으로 유의미하다는 것을 의미합니다.
예시 결과 해석:
# 예시 결과 출력
#
# Kruskal-Wallis rank sum test
#
# data: list(group1, group2, group3)
# Kruskal-Wallis chi-squared = 10.5, df = 2, p-value = 0.005
위 결과에서 p-값이 0.005로, 0.05보다 작으므로 세 그룹 간의 중앙값 차이는 통계적으로 유의미하다고 판단할 수 있습니다.
아래 포스팅도 참고해 보세요! ▶ R의 기본 개념, 예시코드와 알아보는 리스트(List) ▶ R에서 벡터 활용 ▶ 데이터 프레임의 열과 행 삭제하는 법 ▶ RStudio 단축키 모음 ▶ R에서 데이터 정렬하기 |
반응형