역진 귀납법이란 무엇입니까?
게임 이론의 역전 유도는 문제 또는 상황의 끝에서부터 시간이지나면서 유한 한 광범위한 형태와 순차적 게임을 해결하고 일련의 최적의 행동을 추론하는 반복적 인 과정입니다.
역진 귀납 설명
John von Neumann과 Oskar Morgenstern이 1944 년 자신의 저서 인 게임 이론과 경제 행동 을 출판했을 때 학문적 주제로 게임 이론을 확립 한 이후로 역진 귀납법이 게임을 해결하는 데 사용되었습니다.
게임의 각 단계에서 역진 귀납은 게임에서 마지막으로 움직 인 플레이어의 최적 전략을 결정합니다. 그리고 나서, 마지막 플레이어의 행동이 주어진대로 취하여 다음에 마지막으로 움직이는 플레이어의 최적 행동이 결정된다. 이 프로세스는 모든 시점에 대한 최상의 조치가 결정될 때까지 계속 진행됩니다. 효과적으로, 하나는 원래 게임의 각 서브 게임의 내쉬 균형을 결정하는 것입니다.
그러나 역진 귀납법으로 추론 된 결과는 실제 인간의 놀이를 예측하지 못하는 경우가 많습니다. 실험적 연구에 따르면 "이론적"행동 (게임 이론에 의해 예측 된)은 실제 생활에서는 거의 나타나지 않습니다. 불합리한 플레이어는 실제로 지네 게임에서 알 수 있듯이, 역진 귀납법으로 예측 한 것보다 더 높은 보수를 얻습니다.
지네 게임에서 두 명의 플레이어가 번갈아 가면서 많은 돈을 벌거나 다른 플레이어에게 냄비를 넘길 수 있습니다. 팟이 상대방에게 전달되고 상대방이 다음 라운드에서 팟을 가져갈 경우, 이 라운드에서 팟을 가져간 것보다 약간 덜 받도록 배당금이 배정됩니다. 게임은 플레이어가 숨을 쉬 자마자 끝나고 그 플레이어는 더 큰 부분을 얻고 다른 플레이어는 더 작은 부분을 얻습니다.
역진 귀납의 예
예를 들어, 플레이어 A가 먼저 가고, 현재 $ 2에 해당하는 숨김을 "취할"또는 "통과"해야하는지 결정해야한다고 가정하십시오. A와 B가 각각 1 달러를 받으면 A가 통과하면 B 선수가 결정하거나 합격해야합니다. B가 받으면 3 달러를받습니다 (즉, 이전 스태 쉬는 $ 2 + $ 1). A는 $ 0를받습니다. 그러나 B가 합격하면 A는 이제 합격 여부를 결정하게됩니다. 두 선수 모두 항상 패스하기로 선택하면 게임 종료시 각각 $ 100의 대가를받습니다.
게임의 요점은 A와 B가 모두 협력하고 게임이 끝날 때까지 계속 통과하면 각각 $ 100의 최대 지불금을 얻는 것입니다. 그러나 그들이 다른 선수를 불신하고 그들이 첫 기회에“취하기”를 기대한다면, 내쉬 균형은 선수들이 가장 낮은 주장을 할 것이라고 예측합니다 (이 경우 $ 1).
이 게임의 내쉬 균형은 상대방의 선택을 고려한 후 자신이 선택한 전략에서 벗어날 동기가없는 첫 번째 플레이어가 게임의 첫 라운드에서 팟을 가져갈 것을 제안합니다. 그러나 실제로는 상대적으로 적은 수의 플레이어가 있습니다. 결과적으로, 그들은 평형 분석에 의해 예측 된 보수보다 높은 보수를 얻습니다.
역진 귀납법을 사용하여 순차적 게임 해결
아래는 두 플레이어 간의 간단한 순차적 게임입니다. 플레이어 1과 플레이어 2가있는 레이블은 각각 플레이어 1 또는 2에 대한 정보 세트입니다. 트리의 맨 아래에있는 괄호 안의 숫자는 각각의 포인트에 대한 대가입니다. 게임도 순차적이므로 1 번 선수가 첫 번째 결정 (왼쪽 또는 오른쪽)을하고 2 번 선수가 1 번 선수 (위 또는 아래)를 결정합니다.
그림 1
모든 게임 이론과 마찬가지로 역 유도는 합리성과 극대화의 가정을 사용합니다. 즉, 플레이어 2는 주어진 상황에서 자신의 성과를 극대화 할 수 있습니다. 두 정보 중 하나에서 우리는 두 가지 중에서 선택할 수 있습니다. 플레이어 2가 선택하지 않은 선택을 제거함으로써 트리를 좁힐 수 있습니다. 이런 식으로, 주어진 정보 세트에서 플레이어의 보상을 극대화하는 선을 굵게 표시합니다.
그림 2
이 축소 후, 플레이어 1의 선택이 알려 졌으므로 플레이어 1은 그 대가를 극대화 할 수 있습니다. 결과적으로 플레이어 1이 "오른쪽"을 선택하고 플레이어 2가 "위"를 선택하는 역방향 유도에 의해 평형이 나타납니다. 아래는 평형 경로가 굵게 표시된 게임에 대한 솔루션입니다.
그림 3
예를 들어, 회사를 플레이어로 사용하여 위와 비슷한 게임을 쉽게 설정할 수 있습니다. 이 게임에는 제품 출시 시나리오가 포함될 수 있습니다. 회사 1이 제품을 출시하고 싶었다면 회사 2는 어떤 반응을 보였습니까? Company 2는 유사한 경쟁 제품을 출시 할 예정입니까? 다양한 시나리오에서이 신제품의 판매를 예측함으로써 이벤트가 어떻게 전개 될지 예측하는 게임을 설정할 수 있습니다. 아래는 그러한 게임을 모델링하는 방법의 예입니다.
그림 4