건강정책칼럼
건강정책동향
Research Brief
해외통신
이전 포럼웹진
 Research Brief > Research Brief


[Research Brief 11호] 공공자료 분석에서 알고 있으면 유용한 통계분석 방법 4가지에 대한 소개의 글(강민아,이화여대)
 작성자(아이디) hpwebzine  작성자(이름)
 메일주소  홈페이지
 등록일 2010.06.17 12:57:59
 수정일 2010.06.17 14:14:09
 조회수 4,076  다운로드수 0
[해외 통신]

 

[Research Brief 11호]

 

 

공공자료 분석에서 알고 있으면 유용한 통계분석 방법

4가지에 대한 소개의 글

(Some Old and Some new Statistical Tools for Outcomes Research)

 

 

 

 

강민아이화여대, 미국연수 중

원저자:

Sharon-Lise T. Normand 하버드 의대 의료 통계학

 

 

하루에도 수없이 많은 새로운 논문이 쏟아져 나오는 요즈음, 2008년에 발간된 이 논문은 우선은 지금으로부터 ‘무려 2년 전’의 논문이고 논문의 내용도 이미 꽤 알려진 통계 기법을 리뷰해 주는 글인지라 새롭다는 측면에서 눈에 띄는 글은 아니다(그래서 논문의 원제목도 old and new tools이라고 소개하는 듯하다). 하지만 보건의료 정책 연구자로서 누구나 한번쯤은 당면하게 될 제약 상황을 제시하고 그러한 상황에서 사용할 수 있는 통계 기법을 소개한다는 데에서 그 의의를 찾을 수 있다.

특정 의료 행태 또는 치료 방법의 효과를 이해하고자 하는 효과 분석 연구(outcome research)나 새로운 제도나 정책의 효과를 검증하는 연구 등 관심 변수 간의 인과관계를 파악하기 위해서는 무작위 실험 방법을 사용하는 것이 골드 스탠더드이지만 실제로는 관찰 자료(observational studies)를 사용하는 경우도 적지 않다. 특히 대단위의 규모로 수집되는 각종 공공 자료가 증가하는 최근의 추세는 이러한 성향을 반영한다. 관찰 자료를 통해 변수간의 인과 관계를 파악하고자 할 때에는 복잡한 자료를 정확하게 다를 수 있는 보다 엄격한 통계 분석이 필요하다. 왜냐하면 대부분의 관찰 자료들이 우리가 흔히 사용하는 통계 기법의 기본 가정을 위배하는 여러 가지 제약 조건을 가지고 있기 때문이다. 이 논문의 목적은 공공 자료를 이용하여 효과 분석 연구를 할 때 유용하게 사용될 수 있는 중요한 통계 기법들을 검토하고 소개하는 것이다. 이 논문의 저자는 관찰 자료에서 흔히 나타나는 현상을 1) 무작위 배정 결핍 문제, 2) 위계적/군집적 자료 구조 문제, 3) 결측치 문제, 4) 복수의 자료로부터의 취합으로 인한 문제 등 4개로 나누어 설명하고 이러한 상황에서 사용 가능한 통계 분석 방법들에 대해 실제 사례들을 들어 소개하고 있다.

 

1)  무작위 배정의 부재로 인한 문제

인과 관계의 파악을 위한 골드 스탠더드에 의하면 1) 피실험자는 실험 집단에 무작위 배정되어야 하며 2) 대상자 누구든지 선정될 수 있는 기회가 있어야 하며 3) 혼란 변수(‘실험 집단에의 배정’과 ‘실험 효과’에 동시에 영향을 미치는 변수)의 영향이 통제되어야 한다. 여기서 무작위 배정은 일정한 규칙에 따라, 또는 ‘도구 변수’를 이용하여 이루어질 수 있는데 이 때 환자의 결과는 배정 방식이나 도구 변수와는 상관없이 치료 방법(또는 치료 여부 등의 관심 변수)에 의해서만 결정되어야 한다.

관찰 자료를 이용한 연구에서 혼란 변수들을 처리하는 방법은 대략 3가지로 제시된다. 1) 혼란 변수를 통제변수로 한 다중 회귀 분석 2) 혼란 변수를 이용한 매칭 분석(짝짓기하여 그룹 간 비교) 3) 앞의 두 가지 방법을 혼합하여 성향 점수(propensity score)를 만들어 사용하는 방법 등이 가능하다. 여기서 다중 회귀 분석은 혼란 변수들의 분포가 동일하다는 등의 기본 가정이 위배되는 경우가 빈번하여 그 적용이 문제가 될 수 있고 매칭 분석은 혼란 변수의 숫자가 많아지는 경우 조합의 숫자가 기하급수적으로 증가하게 되어 문제가 된다. 따라서 세 번째 방법인 성향 점수의 사용을 권장하고 있다. 관찰 자료를 이용한 인과 관계 추정에 있어서 사실상 가장 심각한 경우는 중요한 혼란 변수가 측정되지 않아서 모델에 포함되지 않은 경우이다(“non-ignorable” treatment assignment). Normand는 이러한 경우 ‘도구 변수’의 사용을 권장한다. 도구 변수를 이용한 분석을 위해 사용 가능한 통계 패키지 프로그램으로는 Stata ivreg와 ivprobit, 또는 SAS Proc SYSLIN 등이 있다. 또한 혼란 변수가 미칠 수 있는 영향력에 대한 민감도 분석 (sensitivity analysis)도 유용한 기법으로 소개되고 있다.

 

2)  위계적 자료 구조

위계적인 구조(다수준적 구조, 예: 환자 – 의사 – 병원 - 지역)로 이루어진 자료의 분석에 대해서는 최근 많은 논의가 이루어지고 이러한 분석 기법을 이용한 연구들이 급속도로 증가하고 있어서 비교적 익숙한 문제일 것이다. 위계적 구조 자료의 문제점은 동일한 집단에 속한 표본 간에는 독립성 가정이 위배된다는 점이다. 즉, 동일한 의사에게 치료를 받는 환자들의 치료 결과는 독립적이라기보다는 상호 연관되는 특징을 가지고 있는 경우가 많다. 이와 같은 위계적인 자료에 적용할 수 있는 잘못된(또는 단순한) 분석 방법으로는 첫째, 위계적 구조를 완전히 무시하고 모든 표본이 독립적이라고 가정하고 분석을 실시하는 경우, 둘째, 각 소속 집단을 고정 더미(dummy)로 모델에 추가하여 분석하는 고정 효과 분석 방법 (fixed-effects model), 셋째로 각 집단의 평균을 구하여 집단 수준에서의 분석으로 환원하는 방법이다. 이러한 방법 대신에 연구 문제와 목적에 따라 한계 효과 분석 (marginal analysis) 또는 다수준 분석(multilevel analysis)의 사용이 가능하다. 다수준 분석에서는 변수의 무작위 효과(random effect)의 추정이 가능하다는 장점이 있다. 한계 효과 분석으로는 SAS의 PROC GENMODE나 STATA의 xtgee, 무작위 효과를 추정하기 위한 다수준 분석으로는 SAS의 PROC MIXED나PROC NLMIXED등을 사용할 수 있다.

 

3)  결측 자료에 대한 처리

최대한의 성실한 자료 수집 노력에도 불구하고 관찰 자료에서의 결측치 발생은 불가피하다. 결측 자료의 대표적인 연구자인 Rubin의 분류에 의하면 결측의 유형은 “무시할 만한 유형(MCAR: missing completely at random과 MAR: missing at random)”과 “무시해서는 안 되는 유형”(NMAR: not missing at random)”으로 나누어질 수 있다. 간단히 설명하자면, 결측이 발생할 확률에 관련된 변수들이 관찰 가능하거나 통계적으로 통제 가능한 경우가 ‘무시할 만한 유형’에 속한다.

이러한 결측치에 대한 대처 방안으로 제시된 대표적인 것으로는 결측치를 포함한 케이스를 아예 분석에서 제외해 버리는 경우(complete case analysis)와 다양한 방법으로 결측치의 값을 추정하여 채워 넣는 대체법(imputation)이 있다. 결측의 유형에 따라 각 대처 방안들이 가져올 수 있는 편의가 달라질 수 있다. 예를 들어 MCAR의 경우에는 대부분의 통계 분석에서 디폴트로 사용되는 완전 자료 분석 (complete case analysis)를 사용하여도 편의가 발생하지 않지만 MAR의 경우에는 발생 가능하다.   MAR이나 MCAR의 경우에는SAS의 Proc MIANALYZE, Proc MI, Proc GENMOD, 또는 Proc NLMIXED등의 사용이 가능하다. 자료의 결측이 무작위가 아니고 결측 발생의 경우를 주어진 자료를 가지고 예측할 수 없는 NMAR의 경우에는 훨씬 더 문제가 복잡해진다. 흥미로운 지적 중 하나는 응답률이 높은 자료의 경우 결측치의 발생에 대해 보다 유의해야 하는 데 이는 결측의 유형에 따라 결측이 분석 결과에 미치는 영향이 훨씬 더 증폭되기 때문이라고 한다.

 

4)  다정보원 또는 복수의 자료 연계 사용

복수의 자료원에서 자료를 취합하거나 복수의 정보원으로부터 자료를 수집하는 경우가 적지 않다. 복수의 정보원에 의존하게 되는 이유는 다양한데 우선 각각의 자료에 대한 신뢰도가 낮은 경우 이를 보완하려고 할 때, 가장 중요한 정보원이나 자료가 어떤 것인지 확실하지 않을 때, 다양한 결과(outcome)에서 나타나는 임상적 효과를 증명하고자 할 때, 표본의 수를 증가하여 통계적 파워를 증진하고자 할 때가 그러하다. 심리학 분야의 연구에서는 복수의 정보원으로부터 자료를 수집하는 방법이 이미 오래 전부터 활용되어서 연구 대상뿐만 아니라 주위의 가족, 친지, 동료들로부터 대상자에 대한 자료를 수집하곤 한다. 의료 정책 연구 분야에서도 의료 서비스의 이용 현황이나 질적 수준에 대한 자료를 수집할 때 의료 서비스 공급자뿐만 아니라 환자로부터 정보를 수집하기도 하며 이와 같은 다정보원 자료 수집은 점점 증가하는 추세이다.

복수의 정보원이나 자료로부터 만들어진 자료를 분석하는 방법 중 대표적인 것으로 자료원의 독립성이나 차이를 무시하고 모든 자료를 단순 취합하여 표본의 수를 증가시키고 분석하는 방법(pooling)이 있다. 또 그와 반대로 개별 정보원이나 자료원을 별도로 취급하여 각각 분석하는 방법도 있다. 그러나 2가지 방법 모두가 제한점이 있다.  이러한 자료를 분석하는 방법으로는 다수준 분석 방법, 한계 분석법 (marginal analysis), 잠재 변수 분석 (latent variable analysis) 등이 사용 가능하다.

---------------------

이 논문에서 소개된 4개의 기법들은 본인이 수학하던 수 년 전에도 이미 사용되었던 것들인데 그 중에서 다수준 분석은 최근 패널 자료나 지역 자료의 수집이 보편화되면서 그 유용성이 강조되는 반면, 성향 점수의 사용이나 결측치 대체 방법 등은 그만큼 주목을 받지 않는 것이 상당히 흥미롭다. 과연 그 이유가 무엇일까 궁금해진다. 혼란 변수로 인해 발생할 수 있는 편이 (bias)에 대한 문제는 주로 계량 경제학에서의 주요 관심사이며 역학 연구에서는 그만큼 관심을 크지 않다. 아마도 분야별 주요 관심이나 연구의 목적이 다르기 때문인 듯하다. 결측치 대체 방법은 아직까지 충분히 활용되고 있지 않지만 대규모의 패널 자료나 지역 자료의 사용이 증가함에 따라 자료에 나타나는 결측치 처리에 대한 관심이 증가될 것으로 예상된다. 또한 공공 자료들 간의 연계가 가능해지면서 복수 자료원의 활용 문제 또한 중요해질 수 있으리라 생각된다.

복잡한 통계적 분석 기법이 연구 문제에 대한 답을 찾아주는 만능 처방이 될 수는 없다. 오히려 때로는 가장 단순한 분석으로 가장 명료하고 정확한 답을 찾을 수 있다. 단지 연구 문제와 목적을 명확히 이해하고 주어진 자료의 장점과 한계점을 정확히 파악하여 그러한 상황에 적합한 분석 방법을 선택하는 것이 연구 결과의 타당성을 제고하는 최선의 전략일 것이다.

 

 

참고 문헌

Normand, S.-L. T. (2008). "Some Old and Some New Statistical Tools for Outcomes Research." Circulation 118(8): 872-884.

강민아∙김경아 (2006). "행정학 및 정책학 조사연구에서 결측치 발생과 처리 방법에 대한 고찰." 「한국행정학보」 40(2): 31-52.