회귀분석이나 ANOVA분석을 하고 F값은 기재했는데 간혹 정확한 p값을 써야하는 경우가 있습니다.
F값은 t값과 달리 자유도 라는 개념때문에 p값을 바로 찾을순 없습니다.
따라서 자유도를 찾는 방법과 p값을 찾는법에 대해서 알아보겠습니다.
목차
1. ANOVA에서 자유도 찾는법
ANOVA의 p값을 알기위해서는 2가지의 자유도 수치를 찾아야합니다.
- 그룹 간의 자유도 (집단의 수 - 1).
- 그룹 내의 자유도 (전체 관찰 수 - 집단의 수).
그룹간의 자유도는 ANOVA를 실행했을때 투입된 변수의 집단 수 입니다.
예를들어 연령대에 따른 차이를 봤을때 20대,30대,40대,50대 이상 으로 코딩하였을 경우,
그룹 간 자유도는 4(집단의 수)-1 = 3 입니다.
만약 10대 이하, 20-40대, 50대 이상으로 코딩되어있으면
그룹 간 자유도는 3(집단의 수)-1 = 2 입니다.
그 다음으로는 그룹내의 자유도를 구할 차례입니다.
전체 관찰 수는 내 데이터의 케이스 갯수 입니다.
만약 300명한테 설문지를 받았고
연령대에 따른 차이를 봤을때 20대,30대,40대,50대 이상 으로 코딩하였을 경우,
그룹 내 자유도는 300(전체 관찰 수)-4 = 296 입니다.
10대 이하, 20-40대, 50대 이상으로 코딩되어있으면
그룹 내 자유도는 300(전체 관찰 수)-3 = 297 입니다.
따라서 필수적으로 필요한 숫자는
- F값
- ANOVA를 수행한 변수의 집단 수
- 내가 수집한 데이터 수
가 되겠습니다.
2. p값 계산 실습
우선 데이터를 준비했습니다.
그룹 이라는 변수는 총 5개집단으로 코딩했고 전체 55개의 데이터 입니다.
ANOVA분석 결과, F값은 .648로 나왔습니다.
옆에 있는 자유도와 유의확률은 분석을 한지 너무 오래되어서 모른다고 가정하겠습니다.
그럼 자유도 계산을 먼저 해보겠습니다
1. 그룹 간의 자유도 (집단의 수 - 1).
5-1=4
2. 그룹 내의 자유도 (전체 관찰 수 - 집단의 수).
55-5=50
입니다.
p값을 간단하게 계산해주는 사이트를 들어갑니다.
https://www.socscistatistics.com/pvalues/fdistribution.aspx
입력창에 F값, 그룹 간의 자유도, 그룹 내의 자유도를 입력하고 Calculate버튼을 클릭합니다.
바로 p값이 출력된것을 확인할 수 있습니다.
SPSS에서는 p값이 .631으로 나타났습니다.
소수점 자리수가 자세하게 나올 수록 수치가 정확히 나오는데
오차를 감안하더라도 사이트에서 나온 수를 반올림을 하면 .631로 나타납니다.
3. 회귀분석에서 자유도 찾고 p값 계산하는 법
회귀분석에서 자유도 계산법은 약간 다릅니다.
- 그룹 간의 자유도 (투입된 독립변수 수).
- 그룹 내의 자유도 (전체 관찰 수 - 투입된 독립변수 수 - 1).
그룹간의 자유도는 회귀분석을 실행했을때 투입된 독립변수의 수 입니다.
예를들어 우울, 스트레스, 급여수준, 회식빈도가 이직의도에 미치는 영향을 분석하였을 경우,
그룹 간 자유도는 4(집단의 수) 입니다.
만약 회식빈도가 이직의도에 미치는 영향을 분석하였을 경우(단순회귀),
그룹 간 자유도는 1(집단의 수) 입니다.
그 다음으로는 그룹내의 자유도를 구할 차례입니다.
전체 관찰 수는 내 데이터의 케이스 갯수 입니다.
만약 300명한테 설문지를 받았고
예를들어 우울, 스트레스, 급여수준, 회식빈도가 이직의도에 미치는 영향을 분석하였을 경우,
그룹 내 자유도는 300(전체 관찰 수) - 4(집단의 수)-1 = 295 입니다.
만약 회식빈도가 이직의도에 미치는 영향을 분석하였을 경우(단순회귀),
그룹 내 자유도는 300(전체 관찰 수) - 3(집단의 수) - 1 = 294 입니다.
바로 실습을 해보겠습니다.
아래 데이터와 같이 55명의 설문조사 결과를 갖고 있다고 가정하면
그룹 간의 자유도는 독립변수가 6개니깐 6
그룹 내의 자유도는 (전체 관찰 수 - 투입된 독립변수 수 - 1) 55-6-1 = 48
입니다.
p값 계산을 위해 아래 주소로 들어갑니다.
https://www.socscistatistics.com/pvalues/fdistribution.aspx
순서대로
F값 .495
그룹 간의 자유도 6
그룹 내의 자유도 48
을 입력하면 p값이 .808896으로 나타난 것을 확인할 수 있습니다.
반올림하면 SPSS에서 나온 p값인 .809와 같다는 것을 알 수 있습니다.
아래 포스팅도 참고해 보세요! ▶ t값보고 p값 계산하기 ▶ 카이 제곱 p값 계산하기 ▶ ChatGPT로 SPSS 기술통계 결과쓰기 ▶ ChatGPT로 SPSS 빈도분석 결과쓰기 |
'통계 > 통계이론' 카테고리의 다른 글
왜도와 첨도에 관한 이야기 (0) | 2023.09.23 |
---|---|
ANOVA 사후검증의 종류와 특징 (0) | 2023.09.14 |
회귀분석 유형과 해석방법 (0) | 2023.07.27 |
알아두면 좋은 통계 관련 단어들 (0) | 2023.06.08 |
분산분석 이해하기 (0) | 2023.04.26 |
최근댓글