반응형

Kaplan-Meier 추정방법은 생존분석에서 가장 널리 사용되는 방법 중 하나로, 생존데이터의 특성을 분석하는 데 필수적입니다. R을 활용하면 이러한 분석을 더욱 간편하게 수행할 수 있습니다. 이번 포스팅에서는 Kaplan-Meier 방법의 기본 개념부터 R에서의 구현 방법, 그리고 분석 결과의 해석까지를 다룰 것입니다.

 

 

목차

 

1. Kaplan-Meier 추정방법 생존분석 이란

Kaplan-Meier 추정방법은 생존데이터 분석에 널리 사용되는 통계적 방법입니다.
이 방법은 특정 시간 동안의 생존확률을 추정하는 데 사용되며, 특히 관찰기간 동안 모든 대상의 종료 이벤트(예: 사망)가 발생하지 않았을 때 유용합니다.
Kaplan-Meier 생존함수는 시간에 따른 생존확률을 그래프로 표시하며, 여러 그룹 간의 생존 차이를 비교하는 데도 사용됩니다.
이 방법은 censored 데이터, 즉 관찰기간 동안 이벤트가 발생하지 않은 데이터를 처리하는 데 특히 효과적입니다.

 

2. R에서 Kaplan-Meier 추정방법 생존분석 하는 법

R에서는 'survival' 패키지를 활용하여 Kaplan-Meier 생존분석을 쉽게 수행할 수 있습니다.
우선, 해당 패키지를 설치하고 불러옵니다.

install.packages("survival")
library(survival)

 

데이터를 준비한 후, `Surv()` 함수를 사용하여 생존 객체를 생성합니다. 이 때, 관찰 시간과 이벤트 발생 여부를 인수로 전달합니다.

surv_obj <- Surv(time = data$time, event = data$event)

 

다음으로, `survfit()` 함수를 사용하여 Kaplan-Meier 추정을 수행합니다.

fit <- survfit(surv_obj ~ 1)

 

마지막으로, 결과를 `plot()` 함수를 이용하여 그래프로 시각화합니다.

plot(fit)

 

3. 분석결과 해석하는 법

Kaplan-Meier 그래프를 통해 시간에 따른 생존확률의 변화를 관찰할 수 있습니다.
Y축은 생존확률을, X축은 관찰 시간을 나타냅니다.
생존곡선이 감소하는 지점은 사건(예: 사망)이 발생한 시점을 나타냅니다.
또한, 여러 그룹의 생존곡선을 비교하여 그룹 간의 생존 차이를 평가할 수 있습니다.
`log-rank` 테스트는 `survdiff()` 함수를 사용하여 두 그룹 이상의 생존곡선이 통계적으로 유의미하게 다른지 평가하는 데 사용됩니다.

test <- survdiff(surv_obj ~ data$group)
print(test)

이 테스트의 p-값이 특정 기준(예: 0.05)보다 작으면 그룹 간의 생존률에 통계적으로 유의미한 차이가 있다고 판단합니다.

 

 

아래 포스팅도 참고해 보세요!

 R에서 흔히 마주치는 에러 상황과 그 대처법 정리
 R에서 결측치 처리하기
 Lavaan 패키지로 확인적 요인분석하기
 R의 기본 개념, 예시코드와 알아보는 리스트(List)
 R에서 t-test하는 방법
반응형
  • 네이버 블러그 공유하기
  • 네이버 밴드에 공유하기
  • 페이스북 공유하기
  • 카카오스토리 공유하기