하나님은 아담에게 "선악과를 먹었느냐"고 Yes/No 답변을 요구했다. (사실 관계를 질문)

아담은 "이브가 선악과를 줬다"고 원인을 답변했다.

마찬가지로 하나님은 이브에게 "아담에게 선악과를 주었느냐"고 Yes/No 답변을 요구했다. (사실 관계를 질문)

이브는 "뱀이 날 유혹했다"고 원인을 답변했다.

 

창세기 선악과 이야기에서 작가가 읽어낸 3가지 함축

1. 세상은 단순한 사실관계(dry facts)로만 이루어지지 않고 모든 일들은 거미줄처럼 인과관계가 얽혀있다.

2. 인과관계 설명은 우리의 지식 대부분을 구성한다.

3. 인과관계를 추론하는 것은 도약(a leap)이 필요하지, 데이터로부터 자연스럽게 발생하지 않는다.

    - 기계학습에서도 마찬가지일 것이다. 데이터를 아무리 많이 학습해도 기계는 설명을 도출하지 못한다. push (인과 구조도, 도메인 지식등)가 필요하다.

    - 인류는 선악과(push)를 먹었다.

 

The Three Levels of Causation

"인과관계란 무엇인가?" 같은 철학적이고 형이상학적인 토론에서 벗어나, 인과 관계를 실제로 적용하기 위한 좋은 질문은 "인과 추론자 (causal reasoner)는 무엇을 하는가?"이다.

다시 말해, 인과추론이 가능한 모델이, 불가능한 모델이 할 수 없는 일 중 가능한 것은 무엇인지를 정의하는 것이다.

인과 추론자의 능력에 따라서 3가지 레벨로 나눈다. (위로 올라가는 질문에 답변 가능할수록 능력이 좋은 인과추론자이다. - 왜 능력이 좋은지는 추후 설명)

1. Association

- Seeing, Observing

- 예) 올빼미는 밤에 움직임을 관찰해서 쥐가 있을 것을 예상하고 달려든다. 알파고는 수백만개의 데이터를 통해 승리하는 패턴을 발견하고 수를 둔다.

- Association이 가능한 인과 추론자는 "What if I see ...?" 질문에 답변할 수 있고, 이는 "예측 (Prediction)"을 가능하게 한다.

- 전통 통계학에서는 이를 가능케하는 방법론들(상관분석, 회귀분석)이 다수 존재

- 하지만 인과관계는 밝혀낼 수 없다.

    - ex) 치실 구매가 증가하면 치약 구매가 증가한다는 것은 알 수 있지만, 인과관계는 알 수 없다.

 

2. Intervention

- Doing

- Association과 달리, X를 했을 때 Y가 어떻게 달라지는지를 답변할 수 있다.

- 개입의 결과를 예측하는 가장 직접적인 방법은 "실험"

- "실험"에 필연적으로 세팅되는 인과 모델을 통해 "What if we do ...?" 질문에 답변할 수 있어진다. -> 이는 미래를 바꿀 수 있게 해준다.

 

3. Counterfactuals

- Imagining, Retrospection, Understanding

- 과거를 변경해야 하는 어려움이 있다. - 데이터는 Fact이기 때문에 Counterfactual을 구하기 위해서는 상상을 동원해야 한다.

- 그동안 과학이 발전한 방식

    - ex) 스프링에 가해지는 무게가 2배가 되면, 스프링의 길이도 2배가 될 것이다. (훅의 법칙)

- 변수들 사이 관계가 함수로 표현 가능해진다.

 

Causal Model의 중요성

- 유발하라리: 인류는 "인지 혁명"이라 일컫는 "상상력"을 통해 진보해왔다.

- 실험만으로는 Why라는 질문에 답변할 수 없다.

- 데이터와 실험 결과를 구조화하는 causal process (때로 이론, 자연법칙으로 불린다)가 있어야 Why에 답변할 수 있다.

- 한층 더 나아가, 이런 이론과 자연 법칙을 부정하는 것도 이런 causal process의 일부다.

 

The Mini-Turing Test

기계가 인과 추론 능력을 어떻게 획득할 수 있을까? (매우 어려운 문제)

-> 기계 (또는 인간이) 인과 추론 능력을 어떻게 표현할 수 있을까? (덜 어려운 문제로 치환)

    1. 필요한 정보 획득

    2. 질문에 정확이 답변

    3. 알고리즘에 의해 함

 

예시

  • CO: Court Order (법원 명령)
  • C: Captain Order (지휘관 명령)
  • A: soldier A shot (병사 A가 총 발사)
  • B: soldier B shot (병사 B가 총 발사)
  • D: prisoner death (죄수 죽음)

1. Association

- 죄수가 죽음과 법원 명령은 연관 관계가 있는가? -> Yes 답변 가능

- A가 발사한 것과 B가 발사한 것은 연관 관계가 있는가? ->Yes (둘 다 동시에 발사하거나, 발사 안 한다) 답변 가능

 

2. Intervention

- 만약 병사 A가 지휘관 명령을 어기고 무조건 발사하겠다고 결심한다면? (규칙 위반)

    - 기계에게 인과관계를 가르치려면, 규칙을 어떻게 어겨야 하는지 (규칙 위반을 통해 인과 관계를 어떻게 발견할 수 있는지) 가르쳐야 한다.

    - 기계에게, 특정 이벤트의 발생 가능성을 통제(개입)할 수 있다고 알려주는 것은, 해당 이벤트로 들어오는 화살표를 모두 제거하고 분석을 진행하는 것을 의미한다.

- 만약 병사 A가 지휘관 명령을 어기고 무조건 발사 안하겠다고 결심한다면? (규칙 위반)

    - 법원 명령이 떨어지면, 병사 B는 발사할 것이기 때문에, 죄수 죽음은 결국 일어날 것이다.

    - CO 때문에 D가 발생했다를 파악해야만 mini-Turing test를 통과할 수 있다.

 

데이터만으로는 인과관계를 잘못 해석할 수도 있다.

예시

  • 백신 접종률: 99%
  • 백신 접종시 부작용 발생확률: 1%
  • 부작용 발생시 사망확률: 1%
  • 백신 접종시 천연두 발생확률: 0%
  • 백신 미접종시 천연두 발생확률: 2%
  • 천연두 발생시 사망확률: 20%

- 확률만 보고 인과 구조를 파악하면, 백신 접종이 더 좋은 선택지라는 것은 당연하다

- 하지만 실제 데이터는 다음과 같다.

  • 백만명 중 99만명이 백신 접종
  • 99만명 중 9,900명이 부작용 발생
  • 9,900명 중 99명 사망
  • 백신 미접종 1만명 중 200명 천연두 발생
  • 200명 천연두 발생자 중 40명 사망

백신 접종으로 인한 사망자 99명이 천연두 발생으로 인한 사망자 40명 보다 많다.

-> 백신 접종은 잘못된 선택?

 

Counterfactual을 적용해보자

  • 백만명이 전부 백신 미접종이라면?
  • 백만명 중 2만명 천연두 발생
  • 2만명 천연두 발생자 중 4000명 사망

백신 미접종자가 많을 수록 사망자가 더 많다.

-> 따라서 백신 접종은 좋은 선택

 

인과 모델은 확률을 수반한다.

X -> Y 관계에서 화살표는, X가 변했을 때, Y가 어떻게 바뀌는지에 대한 규칙 또는 함수를 함축한다.

 

On Probabilities and Causation

철학자들은 그동안 인과관계를 확률을 통해 정의하려 했다.

"확률 증가": X가 Y의 발생확률을 높이면, X는 Y의 원인이다.

 

직관적으로는 그럴듯하지만, 그동안 인과관계를 나타내는 데에 계속 실패해온 정의이다.

수식으로 쓰면 다음과 같다.

P(Y|X) > P(Y)

하지만, 인과관계가 아닌 상관관계일 때도 해당 수식은 성립한다.

아이스크림 판매량이 증가하면, 익사 사고가 증가한다. - 기온 상승이라는 "외부 변수"를 전혀 고려하지 못한 모델이다.

 

이에 따라 인과관계를 정의하려는 노력은, 이런 "외부 변수"를 제거하려는 데에 집중했다.

참고

이 책에서 작가는 인과관계를 정의하지 않는다. - 모든 정의는 오해석의 여지를 만든다.

대신, 인과관계 관련 주요 질문들을 답변하고, 해당 질문들을 답변하는 방법론에 집중한다.

(기하학에 관한 책에서도 점과 선을 굳이 정의하지 않고도, 기하학 문제들에 대한 답변들을 서술한다.)

 

외부 변수를 고려한 정의

P(Y|X, K=k) > P(Y|K=k)

하지만 해당 정의의 맹점은, 어떤 변수들이 K에 포함되어야 하는가?에 대한 질문을 답변하지 못한다는 것이다.

Nancy Carrwright는 1983년 이 맹점을 다파하는 정의를 다음과 같이 내렸다.

K에 포함되는 변수들은 Y와 "인과적으로 관계가 있는" 요인들이다.

하지만 해당 정의는, 인과 관계를 표한하기 위해 인과 관계를 가져다 쓴다는 비판을 받았다.

K에 포함되는 변수들에 대한 기준은 Chapter 4에서 자세히 다룰 예정이다.

 

작가는 do-operator를 활용해 이렇게 정의했다.

P(Y|do(X)) > P(Y)면, X는 Y의 원인이다.

 

확률론에 기반한 통계학이 세상의 수학적 표현을 가능하게 했다면, 인과 추론은 세상이 변했을 때 확률이 어떻게 변하는지를 파악할 수 있게 한다. (개입과 상상력의 힘으로)

+ Recent posts