1950년대 말부터 1960년대 초까지 통계학자들과 의사들 사이의 가장 뜨거운 논쟁: 담배가 폐암의 원인인가?
학계 (나아가 가족끼리도) 의견들이 첨예하게 갈렸다.
Jacob Yerushalmy (A biostatistician at the University of California, Berkeley): 담배 옹호론자
Abe Lilienfeld (An Epidemiologist at Johns Hokins University): 담배 반대론자 - 담배가 폐암의 원인이다
담배-폐암 토론의 성패를 가르는 주요 가설은 다음 내용
- 니코틴에 대한 열망과 폐암의 모두 원인이 되는 미지 변수의 존재 (= confounder)
하지만 때는 아직 confounder에 대한 연구가 본격적으로 시작되기 전이었다. 이 이슈를 과학자들이 어떻게 다루는지를 살펴볼 것
의학계에서 causal question이 답하는 데에 난이도가 높은 것은 모두가 인지하고 있었다
주요 사례는 다음 두 가지: 괴혈병과 콜레라 (둘 모두 각각 비타민 C와 콜레라균이 필요충분 원인인 것은 밝혀냈다)
담배-폐암의 인과관계를 주장하기 어려웠던 이유
- 많은 사람들이 평생 담배를 피고도 폐암에 안 걸리고, 어떤 사람들은 담배를 전혀 피지 않고도 폐암에 걸렸다
- 담배가 아닌 다른 원인(유전, 유독 가스가 있는 업무 환경 등)에 의해 폐암을 걸리기도 한다
- RCT를 적용할 수도 없는 상황 (윤리적 문제)
따라서 Yak과 Fisher가 그랬듯, 상관관계만 주장하고 잠재적인 미지 변수(confounder)가 있을 수 있다고 주장하는게 합리적이다.
Confounder가 없다고 증명해야 하는 것은 담배 반대론자들의 역할
결론적으로는 담배 반대론자들이 승리한다 ("Cigarette smoking is causally related to lung cancer in men")
하지만 한계도 있었다
- 인과추론을 이론으로서 체계화하지는 못했다 (아직 1960년대는 여타 다른 뒷받침되는 이론들이 부족했다)
- Hill's criteria라는 Austin Bradford Hill이라는 영국 통계학자가 만든 가이드라인에 의해 주장이 전개되었다.
- Fisher의 방법론적 접근과 정반대로, 양적 패턴을 기초로 인과관계가 규명되었다.
Tobacco: A Manmade Epidemic
첫번째 근거: (Figure 5.2) 인당 담배 소비율 그래프 증가와 함께 폐암 발병률 그래프도 따라 증가한다. (1940년대 ~ 1960년대)
-> 인과관계를 주장할 수 없다: 1940년대 근대화가 더 본격화되면서 자동차 배기, 도로 타르, 시멘트 등 기관지에 안좋은 기체들이 폐암의 원인이었을 수도 있음
두번째 근거: "Dose-Response effect"
- 담배 피는 사람들이 안 피는 사람들보다 사망률과 폐암 발생률이 몇 배는 높았고
- 담배를 피다가 멈춘 사람들의 경우, 계속 피는 사람들보다 폐암 발생률이 현저하게 떨어졌다.
-> 인과관계를 주장할 수 없다: Smokers are self-selecting
- 유전적으로 또는 기질적으로 비흡연자보다 폐암 발생확률이 높을 수도 있다
-> 재반박: 유전자가 confounder라는 주장은 비겁함 - 증명하기 불가능하기 때문에
- Cornfield's inequality: 유전자가 담배피는 습관을 형성한다는 주장은 수학적으로 불가능하다
- 만약 흡연자가 폐암 발병률이 9배가 높다면, 해당 유전자가 있을 확률이 적어도 9배는 높아야 한다.
- 만약 해당 유전자가 비흡연자에게서 발견될 확률이 12퍼센트라면, 흡연자에게 이 유전자가 있을 확률은 100퍼센트가 넘어감으로 수학적으로 불가능
- 이는 사실 Smoking의 Direct Effect 유무에 따라 다른 모델이 있을 수 있음을 시사하는 (Diagram 5.1 vs 5.2) 중요한 주장
- 나아가 이후 sensitivity analysis라는 통계 기법의 초석이 되었다.
1950년대 실험 증거
- 쥐한테 담배 타르를 입혔더니 암이 발생하더라
-> 대부분 전문가들은 담배가 폐암의 직접적인 원인임을 받아들이기 시작
하지만 담배가 폐암의 원인이라는 결론을 완벽히 내리지는 못했다: 담배회사들의 공작과 Fisher를 비롯한 몇몇 통계학자, 의사들의 고집 때문에
아직 인과추론 기법이 자리잡기 전이기 때문에 이런 주장들을 강하게 반박하지 못했던 것도 사실이다.
The Surgeon General's Commmission and Hill's Criteria
5명의 의학, 통계 전문가들로 구성된 committee를 통해 담배-폐암 인과관계를 밝혀내려는 시도 진행했다.
"원인"을 규명하기 위해서는 당시 통계 방법론에서 탈피해야 했다.
"원인"을 정의하기 위해 5가지 기준을 마련하고 이들을 충족하는지 여부를 통해 판단하려 했다
1. consistency: many studies, in different populations, show similar results
2. strength of association: including the dose-response effect: more smoking is associated with a higher risk
3. specificity of the association: a particular agent should have a particular effect and not a long litany of effects
4. temporal relationship: the effect should follow the cause
5. coherence: biological plausibility and consistency with other types of evidence such as laboratory experiments and time series
(나중에 Hill이 다른 4가지 기준을 추가해, 다른 의학 분야에도 적용되는 Hill's criteria를 만듬 - 다만, 9가지 조건을 모두 충족해야만 원인은 아니다.)
사실, 5가지 기준(그리고 Hill's criteria 모두)을 충족한다고 "원인"이라고 정의할 수는 없다. 각 기준들 모두 abusing될 수 있는 취약점들이 있다.
하지만, 인과관계를 규명하기 위해서는 통계 바깥에서 기준(모델)을 만들어야함을 인지한 것 자체가 인과 추론 연구에 있어 도약이었다.
(인과추론 연구의 가이드로 삼기에는 턱없이 부족한 기준이었다. - 차라리 Conrfield's inequality가 sensitivity analysis의 씨앗이됨으로서 더 큰 성취었다.)
Smoking for Newborns
birth-weight paradox: 신생아가 underweight으로 태어나는 경우, 산모의 흡연이 아기 생존율에 도움을 준다?
-> collider bias였다. (Figure 5.4)
- Birth Weight이 낮은 신생아 데이터만 봄으로써, Smoking과 Mortality 사이의 backdoor path가 열린다: Smoking -> Birth Weight <- Birth Defect -> Mortality (이 backdoor path는 noncausal이다.)
Causal Diagram을 통해 collider bias를 규명할 수 있다.
이 예시는 직관과 반대되는 데이터가 나오기 때문에 collider bias를 규명할 수 있었지만, 일반적인 상식이 형성되지 않은 분야에서는 아직 발견 못한 collider bias가 있을 수도 있다.
Passionate Debates: Science vs Culture
위의 예시에서 Smoking 자리를 Race로 바꾼다면?
실제로 Wilcox의 연구에서 흑인들의 신생아 생존률이 백인들보다 낮은 것을 발견했다.
Wilcox는 나아가, 신생아 몸무게와 생존률 사이의 인과관계가 없다고 주장하여 (Race만이 생존률에 영향을 준다고 주장) 인종차별주의자라는 비판을 받았다.
Smoking과의 차이: Smoking이 원인인 경우 금연을 통해 해결할 수 있지만, Race가 원인이라면 해결이 불가능하다.
비판하기 전에 살펴볼 것은, Race가 직접 생존률에 영향을 주는 것이 아니라, Race로 인한 사회적 변수들의 차이가 생존률에 영향을 줬을 수도 있는 것이다.
작가의 마지막 주장: 사회적 맥락을 전혀 고려하지 않은 과학적 주장은, 주장하는 사람의 의도와 상관 없이 더 악한 세상을 만드는 데에 일조하게 될 수도 있다.
Causal Diagram의 언어는 감정에 좌우되지 않고 인과관계를 규명할 수 있는 방법을 제공해준다.