통계/R

피어슨 상관 분석의 이해와 R에서의 실행

MKKM 2023. 10. 12. 00:18
반응형

피어슨 상관 분석은 두 연속 변수 간의 선형 관계를 평가하는 통계적 방법입니다. 이 가이드에서는 R에서 피어슨 상관 분석을 어떻게 수행하고 그 결과를 해석하는 방법을 살펴보겠습니다.

 

 

목차

  1. 피어슨 상관 분석 (Pearson Correlation Coefficient) 이란
  2. R에서 피어슨 상관 분석 (Pearson Correlation Coefficient)하는 법
  3. 분석결과 해석하는 법

 

1. 피어슨 상관 분석 (Pearson Correlation Coefficient) 이란

피어슨 상관 분석은 두 연속 변수 간의 선형 관계의 강도와 방향을 측정하는 통계적 방법입니다.
이 계수는 -1에서 1까지의 범위를 가지며, 1은 완벽한 양의 선형 관계, -1은 완벽한 음의 선형 관계를 나타냅니다.
0은 선형 관계가 없음을 나타냅니다.
피어슨 상관계수는 두 변수 모두 정규 분포를 따를 때 가장 효과적입니다.

 

2. R에서 피어슨 상관 분석 (Pearson Correlation Coefficient)하는 법

R에서는 cor() 함수를 사용하여 두 변수 간의 피어슨 상관 계수를 쉽게 계산할 수 있습니다.
또한, 상관계수의 유의성을 테스트하기 위해 cor.test() 함수도 사용됩니다.

 

예시 코드:

# 예시 데이터 생성
x <- c(2, 3, 4, 5, 6)
y <- c(5, 6, 7, 8, 10)

# 피어슨 상관계수 계산
correlation <- cor(x, y)
print(correlation)

# 상관계수의 유의성 테스트
test_result <- cor.test(x, y)
print(test_result)

위 코드를 실행하면 x와 y 변수 간의 피어슨 상관계수와 그 유의성을 확인할 수 있습니다.

 

3. 분석결과 해석하는 법

cor.test() 함수의 결과로 반환되는 주요 항목은 피어슨 상관계수, t-값 및 p-값입니다.
p-값은 상관계수의 유의성을 나타내며, 이 값이 작을수록 두 변수 간의 관계가 통계적으로 유의미하다는 것을 의미합니다.

 

예시 결과 해석:

# 예시 결과 출력
# ...
# t = 5.6603, df = 3, p-value = 0.006803
# alternative hypothesis: true correlation is not equal to 0
# 95 percent confidence interval:
#  0.5617797 0.9983068
# sample estimates:
#       cor 
# 0.9701425 
# ...

이 결과에서 p-값은 0.006803으로, 0.05보다 작기 때문에 두 변수 간의 상관관계는 통계적으로 유의미하다고 판단할 수 있습니다.
상관계수는 약 0.97로, 매우 강한 양의 선형 관계를 나타냅니다.

 

 

아래 포스팅도 참고해 보세요!

 RStudio 단축키 모음
 R에서 구조방정식 하는 방법(Lavaan 패키지 사용법)
 R에서 t-test하는 방법
 R에서 두 데이터를 합치는 방법
 R에서 그룹별 합계와 평균 구하기
반응형