정리 공간

1. 성향점수 매칭 (Propensity Score matching) 본문

Data analysis/Statistics

1. 성향점수 매칭 (Propensity Score matching)

GreenD93 2019. 6. 19. 14:48

성향점수 매칭 (Propensity Score Matching PSM)

 

성향점수 매칭 방법은 bias problem을 피하기 위해 주로 쓰이는 방법이다. 실험을 진행하기 위해, 연구대상자를 선정할 때는 무작위 배정(random assignment)을 사용하는 것이 바람직하다. 그러나 임상실험에서는, 이러한 무작위 배정이 윤리적 문제를 발생시킬 수 있다.

 

간단한 예를 들면, 폐암 치료방법으로 수술이 권장되는 경우가 있다. 이 실험 설계에서는 약물 치료와 수술의 차이를 비교 하려한다. 연구대상을 무작위 배정하여 폐암이 걸린 환자에게 “당신은 무작위 배정으로 약물 치료에 선정되었습니다”라고 실험을 진행하는 것이 윤리적으로 옳은 것일까? 당연히 수술로 치료를 받고 싶어할 것이다.

 

준 실험(quasi-experiment)은 무작위 배정의 과정을 거치지 않고 행하는 실험 방법이며, 대표적으로는 관측연구(observational study)가 해당된다. 무작위 배정 없이 특정 집단을 대상으로 연구를 진행하기 때문에, 조금 더 현실적이고 일반적인 장점이 될 수 있다. 그러나 관측연구는 연구대상의 선정에서 선택편향(selection bias)을 피할 수 없고, 무작위 배정에 의하지 않기 때문에 어떤 현상의 원인을 추론하는 것이 근본적으로 불가능하다. 선택 편향이란 특정 공변량 (covariate)에 의하여 연구대상이 특정 처리를 받을 확률이 증가하는 것을 말하며, 이 공변량은 처치군과 대조군 사이의 결과 차이를 규명하는데 혼란변수로 작용하게 된다.

 

정의는 너무 어려우니, 간단한 예를 들어보자.

 

 

흡연이 폐암에 영향을 미치는 정도를 알아보고자 하는 실험을 설계하고자 한다.

 

  

a 사람(흡연 여부 : o, 나이 : 24, 매주 운동시간 : 2, 석면 노출 정도 : 하루 1시간) - A 집단(흡연 o)

 

                                                          vs

 

b 사람(흡연 여부 : x, 나이 : 30, 매주 운동시간 : 0, 석면 노출 정도 : 하루 2시간) - B 집단(흡연 x)

 

 

설명변수(독립변수) x는 당연히 흡연 여부가 될 것이고, 반응변수(종속변수)는 폐암 여부가 될 것이다. 그런데, 과연 이 두 실험자를 비교하는 것이 옳은 것일까? 흔히, 설명변수 외적인 변수들(나이, 운동시간, 석면 노출 정도)을 covariate라고 지칭하는데 이 것들이 폐암발생에 영향을 줄 수도 있지 않는가? 다시 말하면, 동일한 조건이 아니기 때문에 정확하게 흡연이 폐암에 주는 causality(인과성)을 설명하기에는 한계가 존재한다. 따라서, 연구대상의 balance를 맞추는 작업을 짝짓기 매칭 (Propensity score로 matching)을 사용하여 이러한 imbalance한 조건을 피한다.

 

 

 

Propensity score  

 

이에 관한 방법은 Logistic regression을 사용하여 Propensity score를 구한다. Logstic regression은 0~1사이의 확률을 나타내는 함수이다. 이 방법은 처치군에 속하는 경우를 1, 대조군에 포함되는 경우를 0으로 하는 이항반응(binary response)형태로 종속변수를 설정하고, 보정하려는 공변량을 독립변수로 지정하여 로지스틱 회귀분석을 시행한다. 이 모형에 의해 각 대상들의 추정된 확률 (각 대상이 주어진 공변량(covariate)에 의해 처치군에 포함될 확률)이 propensity scroe에 해당된다. 이후, propensity score가 비슷한 처치군-대조군 끼리 짝을 지어 자료를 선정하게 되며 짝을 이루지 못한 것들은 통계분석에서 제외한다.

 

위의 예로서,  흡연 여부(알고 싶은 설명변수, 독립변수)를 제외한 covariate(운동시간, 나이, 석면 노출시간)만으로 설명변수 X로두고, 이를 Logistic regression을 사용하면 흡연 유무를 분류하는 score로서 0~1 값이 나올 것이다.

 

흡연을 한 A 집단 중 특정 사람의 Logistic regression 값(propensity score)와

흡연은 하지 않은 B 집단 중 특정 사람의 Logistic regression 값(propensity score)이 비슷한 사용자끼리 짝을 짓는다.

* 짝은 1:1, 1:n, n:1로 맺을 수 있다.

 

그렇게 짝을 전부 맺어 A와 B의 분포 그래프를 그려보면, 분포의 모양이 비슷해져있을 것이다. 이 분포의 모양이 비슷하게 잘 됬는지 여부로 짝이 잘 맺어졌는지 확인할 수 있다. 성향이 비슷한 친구들끼리만 짝을 지었기 때문에, 당연한 결과.

 

* 1:n 이란 비슷한 성향을 가진 처치군와 대조군을 1:n으로 짝 짓기를 하는 것이다. 

 

왜? 당연히 처치군이 대조군 일반적인 경우 적을 수 있기 때문이다. (치료를 받은 집단보다 치료를 받지 않은 실험참가자가 많은건(구하기 쉬움) 생각해보면 당연한 사실!)

나머지 n:1, 1:1 모두 같은 원리이다.

 

이를 바탕으로, 다시 돌아와서 짝이 지어진 실험군을 통해 처음 가정(흡연이 폐암에 영향을 주는가?)에 대한 분석을 진행한다면,

 

흡연이 폐암에 영향을 미치는 인과성(순수효과)을 알아 볼 수 있을 것이다.

 

 

Subclassification with five subclasses

  

여기서, 한 가지 technique이 추가 된다. confounding variables(설계시 고려되지 않는 변수)를 보정해보자. Cochran's(1968)은 집단을 5개로 나누어 PSM을 실행한다면, 관찰되지 않는 confounding variables의 효과를 90%이상 줄일 수 있다고 주장한다. 이말은 즉슨, 모든 확률이 소숫점 까지 전부 다 같을 수는 없을테니 어느정도 근사치에 도달하면 짝을 지을 텐데, 집단을 처음부터 5등분하고 짝짓기를 하는 것이다.

 

 

 

참고문헌

 

[1] Rosenbaum, P. R., & Rubin, D. B. (1983). The central role of the propensity score in observational studies for causal effects. Biometrika70(1), 41-55.

[2] 고은경, 전효정, 엄성혜, & 이난희. (2018). 성향점수매칭을 활용한 청소년 체험활동 참여에 따른 삶의 만족도 차이. 한국아동학회 학술발표논문집, 143-144.

[3] 이동규. (2016). Propensity score matching method 의 소개. Anesth Pain Med11(2), 130-148.