반응형

회귀분석이나 ANOVA분석을 하고 F값은 기재했는데 간혹 정확한 p값을 써야하는 경우가 있습니다.

F값은 t값과 달리 자유도 라는 개념때문에 p값을 바로 찾을순 없습니다.

따라서 자유도를 찾는 방법과 p값을 찾는법에 대해서 알아보겠습니다.

 

목차

1. ANOVA에서 자유도 찾는법

2. p값 계산 실습

3. 회귀분석에서 자유도 찾고 p값 계산하는 법

 

1. ANOVA에서 자유도 찾는법

ANOVA의 p값을 알기위해서는 2가지의 자유도 수치를 찾아야합니다.

  • 그룹 간의 자유도 (집단의 수 - 1).
  • 그룹 내의 자유도 (전체 관찰 수 - 집단의 수).

그룹간의 자유도는 ANOVA를 실행했을때 투입된 변수의 집단 수 입니다.

예를들어 연령대에 따른 차이를 봤을때 20대,30대,40대,50대 이상 으로 코딩하였을 경우,

그룹 간 자유도는 4(집단의 수)-1 = 3 입니다.

만약 10대 이하, 20-40대, 50대 이상으로 코딩되어있으면 

그룹 간 자유도는 3(집단의 수)-1 = 2 입니다.

 

그 다음으로는 그룹내의 자유도를 구할 차례입니다.

전체 관찰 수는 내 데이터의 케이스 갯수 입니다.

만약 300명한테 설문지를 받았고

연령대에 따른 차이를 봤을때 20대,30대,40대,50대 이상 으로 코딩하였을 경우,

그룹 내 자유도는 300(전체 관찰 수)-4 = 296 입니다.

10대 이하, 20-40대, 50대 이상으로 코딩되어있으면 

그룹 내 자유도는 300(전체 관찰 수)-3 = 297 입니다.

 

따라서 필수적으로 필요한 숫자는

  • F값
  • ANOVA를 수행한 변수의 집단 수
  • 내가 수집한 데이터 수

가 되겠습니다.

 

2. p값 계산 실습

 

우선 데이터를 준비했습니다.

 

 

그룹 이라는 변수는 총 5개집단으로 코딩했고 전체 55개의 데이터 입니다.

 

ANOVA분석 결과, F값은 .648로 나왔습니다.

옆에 있는 자유도와 유의확률은 분석을 한지 너무 오래되어서 모른다고 가정하겠습니다.

그럼 자유도 계산을 먼저 해보겠습니다

 

1. 그룹 간의 자유도 (집단의 수 - 1).

5-1=4

 

2. 그룹 내의 자유도 (전체 관찰 수 - 집단의 수).

55-5=50

 

입니다.

 

p값을 간단하게 계산해주는 사이트를 들어갑니다.

 

https://www.socscistatistics.com/pvalues/fdistribution.aspx

 

Quick P-Value from F-Ratio Calculator (ANOVA)

This should be self-explanatory, but just in case it's not: your F-ratio value goes in the F-ratio value box, you stick your degrees of freedom for the numerator (between-treatments) in the DF - numerator box, your degrees of freedom for the denominator (w

www.socscistatistics.com

 

입력창에 F값, 그룹 간의 자유도, 그룹 내의 자유도를 입력하고 Calculate버튼을 클릭합니다.

 

바로 p값이 출력된것을 확인할 수 있습니다.

SPSS에서는 p값이 .631으로 나타났습니다.

소수점 자리수가 자세하게 나올 수록 수치가 정확히 나오는데

오차를 감안하더라도 사이트에서 나온 수를 반올림을 하면 .631로 나타납니다.

 

 

3. 회귀분석에서 자유도 찾고 p값 계산하는 법

회귀분석에서 자유도 계산법은 약간 다릅니다.

  • 그룹 간의 자유도 (투입된 독립변수 수).
  • 그룹 내의 자유도 (전체 관찰 수 - 투입된 독립변수 수 - 1).

그룹간의 자유도는 회귀분석을 실행했을때 투입된 독립변수의 수 입니다.

예를들어 우울, 스트레스, 급여수준, 회식빈도가 이직의도에 미치는 영향을 분석하였을 경우,

그룹 간 자유도는 4(집단의 수) 입니다.

만약 회식빈도가 이직의도에 미치는 영향을 분석하였을 경우(단순회귀),

그룹 간 자유도는 1(집단의 수) 입니다.

 

 

그 다음으로는 그룹내의 자유도를 구할 차례입니다.

전체 관찰 수는 내 데이터의 케이스 갯수 입니다.

만약 300명한테 설문지를 받았고

예를들어 우울, 스트레스, 급여수준, 회식빈도가 이직의도에 미치는 영향을 분석하였을 경우,

그룹 내 자유도는 300(전체 관찰 수) - 4(집단의 수)-1 = 295 입니다.

만약 회식빈도가 이직의도에 미치는 영향을 분석하였을 경우(단순회귀),

그룹 내 자유도는 300(전체 관찰 수) - 3(집단의 수) - 1 = 294 입니다.

 

바로 실습을 해보겠습니다.

 

아래 데이터와 같이 55명의 설문조사 결과를 갖고 있다고 가정하면

 

 

그룹 간의 자유도는 독립변수가 6개니깐 6

그룹 내의 자유도는 (전체 관찰 수 - 투입된 독립변수 수 - 1) 55-6-1 = 48

입니다.

 

 

p값 계산을 위해 아래 주소로 들어갑니다.

 

https://www.socscistatistics.com/pvalues/fdistribution.aspx

 

Quick P-Value from F-Ratio Calculator (ANOVA)

This should be self-explanatory, but just in case it's not: your F-ratio value goes in the F-ratio value box, you stick your degrees of freedom for the numerator (between-treatments) in the DF - numerator box, your degrees of freedom for the denominator (w

www.socscistatistics.com

 

순서대로

F값 .495

그룹 간의 자유도 6

그룹 내의 자유도 48

을 입력하면 p값이 .808896으로 나타난 것을 확인할 수 있습니다.

 

반올림하면 SPSS에서 나온 p값인 .809와 같다는 것을 알 수 있습니다.

 

아래 포스팅도 참고해 보세요!

 t값보고 p값 계산하기
카이 제곱 p값 계산하기
 ChatGPT로 SPSS 기술통계 결과쓰기
ChatGPT로 SPSS 빈도분석 결과쓰기

 

반응형
  • 네이버 블러그 공유하기
  • 네이버 밴드에 공유하기
  • 페이스북 공유하기
  • 카카오스토리 공유하기