경제학입문

Jason Eco 2017. 6. 7. 03:29

게임 이론과 내쉬균형

 

 

 

경쟁상대의 반응을 고려해 자신의 최적 행위를 결정해야 하는 상황에서 의사결정 행태를 연구하는 경제학 및 수학 이론을 게임 이론Theory of games이라 합니다. 운동경기, 화투, 포커, 바둑, 협상, 전쟁 등 그 유형을 불문하고, 모든 게임의 경기자는 경쟁상대가 취하는 전략을 감안하여 자신의 행위를 결정합니다. 즉 게임의 키워드는 경기자 간의 상호작용interaction입니다. 따라서 모든 게임은 경기자, 전략 및 보수를 기본 골격으로 합니다.

한 사람의 행위가 다른 사람의 행위에 미치는 상호의존적, 전략적 상황에서 의사결정이 어떻게 이루어지는가를 연구하는 게임이론의 중요한 특징 중 하나는 의사결정자들이 합리적으로 선택한다는 점입니다. 의사결정자들의 선호는 명확하게 정의되어 있습니다. 또 다른 특징은 사람들이 상대방의 반응을 충분히 고려하고 의사결정을 내린다는 점입니다.

게임이론은 1944년 수학자인 폰 노이만John von Neumann과 경제학자인 모르겐슈테른Oskar Morgenstern의 공저 <게임이론과 경제 행태Theory of Games and Economic Behavior>에서 처음 등장했습니다. 이후 1994년 노벨경제학상을 수상한 존 내쉬John Nash(1928-2015)의 내쉬균형Nash's Equilibrium에 의해 발전했으며 다양한 분야에서 폭넓게 활용되어 왔습니다. 20세기 최고의 수학자로 꼽히는 존 내쉬는 1050년에 쓴 프린스턴 대학 박사학위논문 <비협조 게임>을 통해 내쉬 균형 개념을 처음 제시했습니다.

경쟁자들의 전략 변경, 즉 선택의 이탈 유인이 없어진 상태인 내쉬균형이란 상대의 전략을 예상할 수 있을 때 자신의 이익을 최대화하는 전략을 선택하여 형성된 균형 상태를 말합니다. 상대의 대응에 따라 최선의 선택을 하면, 균형이 형성되어 서로 자신의 선택을 바꾸지 않게 됩니다. 상대의 전략이 바뀌지 않으면 자신의 전략 역시 바꿀 유인이 없는 상태입니다. 양쪽 모두 전략을 바꿀 이유가 없는 최적의 상태를 가리킵니다. 오늘날 정치적 협상이나 경제 분야에서 전략으로 널리 활용되고 있습니다.


 

게임 이론의 핵심은 '합리성의 공통 지식(common knowledge of rationality)'이다. 이를 풀어서 쓰면, 모든 경기자들은 게임의 보수와 규칙을 이해하고 있으며, 자신에게 가장 이득이 되는 선택을 한다는 것이다. 이를 기반으로 게임이론의 중추적 역할을 하고 있는 내쉬균형(Nash Equilibrium; NE)을 생각해보자.


우월전략이 있는 경우의 내쉬균형

앞서 본 죄수의 딜레마에서는 우월전략이 있었다. 상대가 어떤 결정을 하든 나는 자백을 하는 것이 유리하다. 이렇게 하나의 결론이 있는 경우 그 전략을 우리는 우월전략(dominant strategy)이라고 부른다. 이 때 내쉬균형은 당연히 둘 다 자백을 하는 상황이다. 



이번 포스트 부터는 게임이론에서 공식적으로 사용하는 보수행렬(payoff)로 표현한다. 행에 해당하는 플레이어의 보수를 앞에 쓰고, 열에 해당하는 플레이어의 보수를 뒤에 쓴다. (행, 열) 이렇게. 이 상황에서 내쉬균형은 오직 하나가 존재하며, (5, 5) 이렇게 표현한다. 최상의 시나리오인 둘 다 함구하는 것은 내쉬균형이 아니다. 여기에서 우리는 한 가지 사실을 알 수 있다. 내쉬균형은 파레토최적이 아닐 수 있다.



우월전략이 없는 경우의 내쉬균형

지난 포스트에서 보았던 롭과 타이윈의 사례를 살펴보자.



이 경우 롭과 타이윈은 동일한 결정을 해야한다. 둘다 군비를 증강하거나 감축하거나. 이 경우에는 우월전략이 없다. 상대의 결정에 영향을 받게 된다. 이 때의 내쉬균형은 2개가 된다. (40, 40) 그리고 (80, 80). 여기에서 우리는 또 한 가지의 사실을 알 수 있다. 내쉬균형은 1개가 아닐 수도 있다.



내쉬균형이 없는 경우; 혼합전략내쉬균형

사실 내쉬균형이 존재하지 않는 경우는 없다. 이를 증명해냄으로서 내쉬는 1994년 노벨경제학상을 수상한다. 단지 내쉬균형을 발견한 것만으로 받은 것이 아니다. 내쉬균형의 발견은 1950년대 초의 이야기다. 그리고 그 이전에도 폰 노이만(Von Neumann)등과 같은 학자들에 의해 꾸준히 언급은 되어왔다.


내쉬균형이 존재하지 않는다는 것은 '순수전략(pure strategy)'에서 존재하지 않는 다는 것이다. 순수전략이란 '혼합전략(mixed strategy)'에 대비되는 단어로, "정규형 게임에 나타난 전략 중 100% 확률로 선택하게 되는 전략을 의미한다."라고 들 정의하고는 있지만, 이것이 무슨 말인지 와닿지는 않는다.  무슨 말인지는 혼합전략의 대표적인 게임 '가위, 바위, 보'를 통해 직관적으로 깨닳을 수 있다.



이 처럼 가위바위보는 당연히 우월전략이 없는 게임이며, 두 사람 모두 만족하는 결과도 없는 게임이다. 앞서 살펴본 두 게임. '죄수의 딜레마', '군비문제'는 비교적 합의를 할 수 있는 균형점이 있었다. 그리고 우리는 그것을 (행, 렬)로 표현했다. 하지만 가위바위보에서는 그러한 것이 없다. 이 때, 내쉬균형을 도출하는 방법은 확률로서 그것을 표현하는 것이다.


가위바위보를 무작위로 낼 때와 가위만 내는 사람 중 누가 승률이 높다고 기대되는가. 당연히 무작위로 내야 한다. 그렇지 않으면 상대방은 주먹만 냄으로서 승리를 보장받기 때문이다. 따라서, 이 때의 표현형은


%5CCalign%20(%5Cfrac%20%7B%201%20%7D%7B%203%20%7D%2C%5Cquad%20%5Cfrac%20%7B%201%20%7D%7B%203%20%7D%2C%5Cquad%20%5Cfrac%20%7B%201%20%7D%7B%203%20%7D)%20


이 된다. 이제 순수전략의 의미를 파악해보자. 순수전략의 경우에는 '죄수의 딜레마', '군비문제'에서 처럼 확률을 따지지 않았다. 각 플레이어들은 (5, 5)를 반드시 선택할 것이며, (40, 40) 또는 (80, 80)을 반드시 선택한다. 하지만 가위바위보에서는 각각의 비율이 100%확신하여 가위나 바위나 보를 내지 않기 때문에 확률에 기인하여 위와 같이 표현되는 것이다.


한 가지 사례를 더 보자. 야구의 예가 있다. 투수는 직구와 포크볼만 던진다고 하자. 실제 일본리그에서 뛰는 투수들은 이러한 경우들이 더러 있다. 이 때, 타자는 직구의 경우 공이 오는 대로 휘둘러야 하고, 포크볼인 경우에는 실제 보이는 궤적보다 아래를 쳐야 한다(일본리그는 스트라이크 존의 상하 높이가 길어 포크볼이 스트라이크인 경우가 많다). 이를 보수 행렬로 나타내면 다음과 같이 예로 들 수 있다.



타자 전략의 기대이득. 투수가 직구를 던질 확률을 p라고 한다면, 타자가 궤적중앙을 휘두르는 것과 하단을 휘두르는 것에 대한 기대이득은 다음과 같이 표현된다.


%5CLalign%20conter%5Cquad%20%3A%5Cquad%2010p-5(1-p)%5Cquad%20%3D%5Cquad%2015p-5%5CLalign%20lower%5Cquad%20%3A%5Cquad%20-5p%2B15(1-p)%5Cquad%20%3D%5Cquad%20-20p%2B15%20


이 때, 궤적중앙과 하단을 휘두르는 것은 어떤 것이 더 유리하다고 할 수 없으므로, 두 식을 같다라고 볼 수 있다.


15p-5%5Cquad%20%3D%5Cquad%20-20p%2B15%5C%5C%20%5Ctherefore%20%5Cquad%20p%5Cquad%20%3D%5Cquad%20%5Cfrac%20%7B%204%20%7D%7B%207%20%7D%20

p가 4/7이라는 것은 앞에서 설정했듯, 직구의 비율이 4/7이라는 것을 의미한다. 따라서 포크볼의 비율은 3/7이 된다. 


투수 전략의 기대이득. 위에서 본 다른 게임이론의 예시문항과 같이 타자 전략의 기대이득과 동일하게 나타난다. 


따라서 내쉬균형은


(%5Cfrac%20%7B%204%20%7D%7B%207%20%7D%2C%5Cquad%20%5Cfrac%20%7B%203%20%7D%7B%207%20%7D)%20


로 표현된다. 여기에서 우리는 확률을 구하는데 우선점을 둘 것이 아니다. 순수전략 내쉬균형과 혼합전략 내쉬균형의 차이점을 살펴보아야 한다. 순수전략의 경우 "100%확률로 선택되는 전략"이라는 의미에 따라 항목별로 확률을 구할 필요가 없었다. 따라서 보수행렬에 주어진 숫자가 그대로 (행, 렬)에 나타났다. 하지만 혼합전략 내쉬균형의 경우에는 확률 계산을 통해야 하기 때문에 그 값이 수정될 수 있다는 것이다. 개념적인 이해가 중요하다.


내쉬균형의 성질

위에서 살펴본 세 가지 주안점을 정리해보자. ①내쉬균형은 1개 이상일 수 있다 ②내쉬균형과 파레토효율은 다를 수 있다 ③순수전략 내쉬균형은 존재하지 않을 수 있다 ④그러나 혼합균형 내쉬균형은 항상 존재한다

관련