본문 바로가기

공부/철학

[철학] 협조할 것인가, 배신할 것인가

존 내시

 

내시균형: 게임에 참가한 어떤 참가자가 다른 선택지를 고른다 해도 기대치가 올라가지 않는 상태

→균형을 이룬 상태

 


 

앨버트 터커가 만든 죄수의 딜레마(prisoner's dielemma)라는 사고실험이 있습니다. 만약 2인도 강도를 체포했을 때 두사람 모두 묵비권을 행사하면 둘 모두 형기 1년, 두사람 모두 자백을 했을 때에는 형기 5년, 1명이 자백하고 1명이 묵비권을 행사하면 자백자는 무죄고 나머지 1명이 형기 10년이라고 했을 때 어떤 선택을 하는 것이 가장 합리적인가 하는 유명한 사고실험입니다.

 

여기서 우리는 '상대가 자백을 하든 묵비권을 행사하든 자백하는 것이 합리적'이라는 판단을 하게 됩니다. 그러나 선택이 합리적이라고 해서 참가자 전체의 이득이 최대화 되지는 않습니다. 이를 우리는 논제로섬 게임(non-zero sum game)이라고 합니다.

 

이 죄수의 딜레마를 프로그램화시켜서 가장 많은 승률을 가진 프로그램이 우승하는 '반복적 죄수의 딜레마 게임'이 있습니다. 당연히 여러 논리학자들과 프로그래머들이 달라붙었지만 결국 복잡한 코드를 지닌 여러가지 프로그램들을 제치고 단 '3행'으로 이뤄진 프로그램이 우승하게 됩니다. 이 프로그램의 코드는 간단히 설명하자면 이렇습니다.

 

처음 '협조'
두번째 '상대가 처음에 냈던 것'
이 두 과정 '반복'

 

이 프로그램은 처음에는 결코 배신하지 않습니다. 그리고 두번째 부터는 상대가 처음에 택한 선택지를 선택하게 됩니다. 그러니 상대가 협조하는 한 계속 협조합니다. 하지만 상대가 배신할 경우에는? 바로 배신합니다. 상대가 다시 협조하면 다시 협조로 돌아섭니다. 이 'Tit For Tat', 즉 '눈에는 눈, 이에는 이' 전략은 협력하지 않으면 보복한다는 무시무시한 전략처럼 보이지만 상대가 다시 협조하면 협조해주는 '포용성' 이라는 개념또한 존재합니다.

 

우선 협조하고, 배신당하지 않는 한 협조하라. 이는 '반복적 죄수의 딜레마'와 별반 다를게 없는 인간사회를 살아가는 우리에게 많은 시사점을 남겨줍니다.