역설(Paradox)은 착시현상과 마찬가지로 우리 뇌가 어떻게 동작하고, 어떤 식으로 판단을 내리는지를 알려준다.

인과관계에서의 역설(Paradox)은 직관적인 인과추론이 확률과 통계 논리와 어떻게 충돌하는지를 밝혀준다. 

 

The Perplexing Monty Hall Problem

몬티홀 역설에서 최종 선택시 문을 바꾸는게 이길 확률이 2배 높다는 것을 사람들은 받아들이지 못한다.

"문을 바꿀 확률과 안 바꿀 확률이 동일해야 하는 것 아닌가?"

이렇게 생각하는 이유는, 그 동안의 확률 통계학문이, data에만 집중했을 뿐 data가 만들어지는 과정(= model)은 전혀 고려하지 않았기 때문이다.

1. Causal Diagram을 활용한 설명 (Causal Reasoning)

몬티홀 역설에서 Causal Model은 다음과 같다.

Your Door -> Door Opened

Location of Car -> Door Opened

Door Opened는 Your Door와 Location of Car에 모두 영향을 받는 Collider이다.

따라서 Door Opened가 conditioned 되어버린 순간, Your Door와 Location of Car는 독립이 아니게 된다.

만약 규칙을 바꿔서, 사회자도 Location of Car를 모른다고 치자.

그렇다면, Causal Model은 다음과 같이 될 것이다. (Location of Car와 Door Opened는 독립이 된다.)

Your Door -> Door Opened

Location of Car

이 때는 선택지를 바꾸나 안 바꾸나 이길 확률이 동일하다. Door Opened가 conditioned되어도 Your Door와 Location of Car가 독립인 채로 유지되기 때문이다.

 

2. Transfer of information 관점에서의 설명 (Bayesian Reasoning)

당신이 Door 1을 선택했다고 하자.

규칙에 따라 사회자는 Door 1과 Location of Car을 제외한 선택지를 Open해야 한다.

사회자가 Door 3를 열었다고 하자. 이는 Door 1 또는 2가 Location of Car라는 뜻이다.

결국 이 문제는 당신의 첫 선택(Door 1)이 맞았느냐(Door 1 = Location of Car), 틀렸느냐(Door 1 != Location of Car)로 치환된다. 

처음부터 맞는 선택을 확률은 1/3이므로 틀렸을 확률은 2/3 (=1-1/3)이다. Door 2는 첫 선택이 틀렸을 경우를 대변하는 선택지 (Door 3가 이미 열렸으므로)이다. 

이는 반박을 위한 test(실험)로부터 잘 살아남은 가설일 수록 참일 확률이 올라간다는 Bayesian 분석의 주제와도 맞닿아 있다.

(애초에 대상이 아닌) Door 1과 달리 Door 2는 사회자가 문을 여는 선택의 후보가 된다. 사회자가 Door 3를 열었다는 것은, Door 2가 꽝일 확률로부터 한 차례 살아남았다는 뜻이다. 아무런 검증(사회자의 선택)도 받지 않은 Door 1과 달리, Door 2는 사회자가 꽝이 아닐 수 있다는 실험을 한 차례 해 준 것이다.

 

More Collider Bias: Berkson's Paradox

두 가지 질병과 입원 사이의 Causal Diagram이 다음과 같다고 하자.

Disease 1 -> Hospitalization

Disease 2 -> Hospitalization

질병 1과 질병 2는 독립이지만, 입원한 사람들(Hospitalization = True)인 사람들만의 데이터로 상관관계를 구한다면, Disease 1과 Disease 2가 상관관계가 있다는 잘못된 결론을 내리게 될 수도 있다.

이 또한 마찬가지로 Collider (Hospitalization)을 통제했기 때문에 발생하는 오류이다.

철학자 Hans Reichenbach는 "No correlation without causation"이라는 상당히 과감한 주장을 했는데, 이는 Collider를 고려하지 못한 주장이다. (Direct effect와 Confounder만 있는 세상에서는 맞는 이야기일 수 있다.)

만약 동전 2개를 던지고, 둘 중 하나라도 앞면이 나오는 경우만 기록을 한다고 가정하자.

그 기록들을 보면 두 동전이 독립이 아니라는 잘못된 결론을 내릴 수 있게 된다.

왜냐하면, 둘 중 하나라도 앞면이 나오는 경우만 기록하는 행위가, Collider를 통제하는 것이기 때문이다.

동전 예시에서는 이게 잘못된 결론이라는 것을 쉽게 파악할 수 있지만, 현실 세계에서는 자기도 모르게 Collider를 통제하곤 한다.

(건강한 사람들의 데이터도 포함해야 하는데, 입원한 사람들의 데이터만 보는 등)

 

Simpson's Paradox

어떤 약물 D가 데이터 상, 남성에게도 안 좋고, 여성에게도 안 좋지만 모든 사람들에게는 좋을 수 있을까? -> 그럴 수 있다.

이 역설을 해결하기 위해서는 마찬가지로 데이터가 어떻게 생성되었는지를 봐야 한다. (이 데이터는 랜덤 추출된 것이 아니다; 환자들이 약물 D 복용 여부를 직접 선택해서 만들어진 데이터다.)

 

역설을 해결하는 데에 4가지 과정을 거친다.

1. 왜 사람들이 이 역설을 어려워하고 놀라는지를 밝혀낸다.

2. 역설을 다른 문제로 치환(identify)한다.

3. 이 다른 문제에는 역설이 없음을 밝힌다.

4. 처음 역설에서 충돌하는 2개의 명제 중 참인 명제를 선택한다.

 

1. Simpson's Paradox를 Simpson's Reverseal과 구분한다.

a/A > b/B, c/C > d/D 라고 (a+c)/(A+C) > (b+d)/(B+D)가 아님은 산수 공부를 한 사람이면 누구나 알 수 있다. 

(a+c)/(A+C)는 가중 평균으로서, 더 큰 수로 수렴한다.

따라서 저 수식 자체에는 역설이 없다. 역설은 수학을 넘어 더 깊은 믿음에서 기인한다.

 

2. 여전히 위의 약물 예시가 역설로 느껴지는 이유

한 약물이 동시에 2가지 충돌되는 사실을 충족시킬 수 는 없기 때문이다. "여자한테는 안 좋지만, 사람한테는 좋다?"

이렇게 생각하는 직관은 전혀 틀린게 아니다. (저 문장은 논리적 모순이 맞다.)

다른 예시를 들어보자. (Savage's sure-thing principle)

사건 C가 발생하면, A는 1달러에서 1.05달러가 되고, B는 1달러에서 1.08달러가 된다.

사건 C가 발생 안하면, A는 1달러에서 1.3달러가 되고, B는 1달러에서 1.4달러가 된다.

 

3. 사건 C가 발생하던 안하던, B가 A보다 더 높게 오르므로 B를 선택하는 것이 합리적인 선택이다. (역설이 전혀 아니다.)

다만 필요한 전제는, A 또는 B를 선택하는 것이 C가 발생할 확률에 영향이 없어야 한다는 것이다.

만약, B를 선택하면 C가 발생하고, A를 선택하면 C가 발생 안한다고 하면,

B 선택하면 0.08 달러를 벌 수 있는 반면, A를 선택하면 0.3 달러를 벌 수 있기 때문에, A를 선택하는 것이 더 합리적인 선택이 된다.

따라서 약물 D 문제를 AB 달러 예시로 치환하기 위해서는 이 가정이 타당한 가정인지를 검증해야 한다.

당연히 약물 D 선택 여부가 성별을 바꾸지는 않으므로 타당한 가정이라고 볼 수 있다.

 

4. 다음 단계에서 살펴봐야 하는 것은 데이터가 어떻게 만들어졌는지를 Causal Diagram으로 파악하는 것이다.

Gender -> Drug

Gender -> Heart Attack

Drug -> Heart Attack

Gender가 Confounder다. 데이터에 따르면, 여성들이 남성들보다 약물 D를 더 선택하는 경향이 있다.

편향 없는 데이터 해석을 위해서는 confounder가 되는 Gender를 통제하고 분석해야 한다. 이는 여성 데이터와 남성 데이터를 각각 보고 평균을 내려야 한다는 뜻이다. (가중 평균을 하는 것이 아니라)

 

각각 구해서 평균 내리는게(Partitioning) 항상 옳다는 뜻은 아니다.

데이터가 어떻게 만들어지는지 Causal Model을 보고 판단을 내려야 한다.

만약 데이터는 같고, Causal Diagram이 이랬다면 어땠을까? (Gender를 Blood Pressure로 바꾼다. 여기서 Drug은 Blood Pressure를 낮춰준다.)

Drug -> Blood Pressure

Drug -> Heart Attack

Blood Pressure -> Heart Attack

이 Causal Model에서의 결론은, Drug이 Heart Attack을 완화하는 데에 도움이 된다이다. (Table 6.6)

여기서 Blood Pressure는 Mediator다.

이 경우에는 Partitioning (Stratifying)이 불필요하고, 오히려 Drug의 다른 causal path (indrect effect)를 함께 측정 못하는 결과를 낳는다.

 

이 예시들의 결론은 분석을 하는 데에는 통계 뿐만 아니라 extra information이 필요하다는 것이다. (Causal Model을 그려야 한다.)

Simpson's Paradox in Pictures

위의 예시는 변수들이 bianary(Drug D를 복용한다 안한다, Heart Attack에 걸린다 안 걸린다) 였지만 continuous variable로도 예시를 만들 수 있다. 오히려 시각화가 더 용이해서 이해하기 더 쉽다.

Figure 6.6 예시: age별로 그룹을 나눴을 때, 운동할 수록 콜레스테롤 수치가 낮아지지만, age별로 안 나누면 운동할 수록 콜레스테롤 수치가 높아진다는 해석이 나온다.

앞의 예시와 마찬가지로, age가 운동량과 콜레스테롤 수치의 confounder이다. age가 많을 수록 건강 관리를 위해 운동을 더 많이 하게되므로, age로 그룹을 나눠서 해석하는게 올바른 분석이다.

 

Lord's Paradox (Figure 6.7)

어떤 식단이 체중 증가에 효과가 있는지를 검증하고 싶다. 특히 성별에 따라 다른 효과가 있는지 검증하고 싶다.

학교 안에서 실험을 했을 때, 여학생 집단과 남학생 집단 각각 모두 W_I (식단 시작 전 몸무게)와 W_F (식단 종료 후 몸무게)가 동일한 분포를 보였다.

첫번째 주장: 여학생 집단과 남학생 집단 모두 W_I와 W_F가 동일하니 해당 식단은 체중 감량에 효과가 없다. 성별에 따라 효과가 다르지 않다.

두번째 주장: 식단 시작 전에 특정 몸무게를 가진 집단(W_I = W_0)만 봤을 때(Deconfounding?), 남학생들이 여학생들보다 식단으로 인한 체중 증가 효과가 더 크다.

 

두번째 주장의 오류: Causal Diagram (Figure 6.8)을 그렸을 때, W_I는 성별과 Y(체중 증가량)의 Confounder가 아니다. Mediator다.

따라서 W_I=W_0으로 W_I를 통제하는 것은, Deconfounding이 아니라 성별의 Indirect Effect(W_I에 주는 영향)를 제거하는 것 밖에 안된다. Y=W_F - W_I이므로 성별은 Y에 두 가지 Indirect Effect로 영향을 주는데(W_I, W_F) 이 중 절반을 차지하는 W_I의 영향을 제거하고 S와 Y의 관계를 해석하는 것은 오류이다.

이는 앞에서의 sure-thing principle의 전제도 충족시키지 못하는데, 여기서 Treatment에 해당하는 성별이 W_I의 분포에 영향을 끼치기 때문이다. 따라서, W_I로 partitioning해서 데이터를 해석하는 것은 잘못된 분석이다.

 

이 실험은 사실 처음부터 하자가 있는데, 바로 식단을 Treatment로 두고 대조군과 실험군을 세팅하지 않았다는 것이다.

이제 상황을 바꿔서 식단을 경험한 집단과 하지 않은 집단으로 그룹을 나눈다고 가정하자.

하지만 이때 랜덤하게 배분을 하지 못해서 대조군(Dining Room A)에 W_I가 더 적은 학생들이 몰려있었다고 하자. (Figure 6.9)

이 때는 W_I=W_0로 partitioning하는게 올바른 접근이다.

왜냐하면 이때는 W_I가 Confounder기 때문이다.

 

+ Recent posts