혼합전략
1. 혼합전략의 개념
학습목표
다음 질문에 대해 답을 할 수 있다.
순수전략 내쉬균형은 항상 존재할까?
혼합전략에서 어떤 전략이 선택될지 알 수 있을까?
합리화전략과 혼합전략 사이의 관계는 무엇일까?
다음 문제를 생각해보자.
순수전략 내쉬균형이 존재하지 않는 게임의 특징은?
혼합전략을 적용하면 보수는 어떻게 결정될까?
★ 핵심만 쏙쏙!
순수전략에 선택될 확률을 부여하면 혼합전략!
순수전략 균형이 존재하지 않는 게임
홀짝 게임(Matching Pennies)
경기자: 각각 여러 개의 동전을 가진 두 경기자
전략 집합: {홀, 짝}
보수표
우월전략, 열등전략 모두 없음
네 가지 전략 조합에서 전략을 바꿀 유인이 있는지 판단
전략 조합 1: (홀, 홀)
경기자 1의 입장: 전략을 바꿀 유인 있음(홀 \(\rightarrow\) 짝)
\(u_{1}\)(홀,홀) \(= - 1 < u_{1}\)(짝,홀) \(= 1\)
경기자 2의 입장: 전략을 바꿀 유인 없음
\(u_{2}\)(홀,홀) \(= 1 \geq u_{2}\)(홀,짝) \(= - 1\)
전략 조합 2: (홀, 짝)
경기자 1의 입장: 전략을 바꿀 유인 없음
\(u_{1}\)(홀,짝) \(= 1 \geq u_{1}\)(짝,짝) \(= - 1\)
경기자 2의 입장: 전략을 바꿀 유인 있음(짝 \(\rightarrow\) 홀)
\(u_{2}\)(홀,짝) \(= - 1 < u_{2}\)(홀,홀) \(= 1\)
전략 조합 3: (짝, 홀)
경기자 1의 입장: 전략을 바꿀 유인 없음
\(u_{1}\)(짝,홀) \(= 1 \geq u_{1}\)(홀,홀) \(= - 1\)
경기자 2의 입장: 전략을 바꿀 유인 있음(홀 \(\rightarrow\) 짝)
\(u_{2}\)(짝,홀) \(= - 1 < u_{2}\)(짝,짝) \(= 1\)
전략 조합 4: (짝, 짝)
경기자 1의 입장: 전략을 바꿀 유인 있음(짝 \(\rightarrow\) 홀)
\(u_{1}\)(짝,짝) \(= - 1 < u_{1}\)(홀,짝) \(= 1\)
경기자 2의 입장: 전략을 바꿀 유인 없음
\(u_{2}\)(짝,짝) \(= 1 \geq u_{2}\)(짝,홀) \(= - 1\)
홀짝 게임의 균형
네 가지 전략 조합 모두에서 적어도 한 경기자는 전략을 바꿀 유인이 있음
순수전략 내쉬균형 없음
순수전략을 선택할 확률을 도입
혼합전략(mixed strategy)
선택할 가능성이 있는 순수전략(합리화전략)을 어떤 확률분포에 따라 무작위로 추출 또는 선택
※ 무작위 전략(randomized strategy)
혼합전략을 활용할 때 어떤 전략이 선택될지는 사전적(ex-ante, prior)으로는 알 수 없음
확률분포에 따라 무작위로 추출 또는 선택하기 때문에 어떤 순수전략이 선택될 경향성만 추정이 가능
혼합전략 예시 1
홀짝 게임에서 ‘홀’ 또는 ‘짝’을 선택할 확률분포를 정의
\(\rightarrow\) 주사위를 던져서 홀수가 나오면 ‘홀’, 짝수가 나오면 ‘짝’
주사위를 던질 때 표본공간 \(S = \left\{ 1,\ 2,\ 3,\ 4,\ 5,\ 6 \right\}\)
홀수 \(O = \left\{ 1,\ 3,\ 5 \right\}\), 홀수가 나올 확률 \(\Pr\left\{ O \right\} = \frac{n(O)}{n(S)} = \frac{3}{6} = \frac{1}{2}\)
짝수 \(E = \left\{ 2,\ 4,\ 6 \right\}\), 짝수가 나올 확률 \(\Pr\left\{ E \right\} = \frac{n(E)}{n(S)} = \frac{3}{6} = \frac{1}{2}\)
‘홀’을 선택할 확률 \(\frac{1}{2}\), ‘짝’을 선택할 확률 \(\frac{1}{2}\)
혼합전략 예시 2
홀짝 게임에서 ‘홀’ 또는 ‘짝’을 선택할 확률분포를 정의
\(\rightarrow\) 주사위를 던져서 ‘6의 약수’가 나오면 ‘홀’, ‘6의 약수가 아닌 수’가 나오면 ‘짝’
주사위를 던질 때 표본공간 \(S = \left\{ 1,\ 2,\ 3,\ 4,\ 5,\ 6 \right\}\)
6의 약수 \(A = \left\{ 1,\ 2,\ 3,\ 6 \right\} \rightarrow \Pr\left\{ A \right\} = \frac{n(A)}{n(S)} = \frac{4}{6} = \frac{2}{3}\)
6의 약수가 아닌 수 \(B = \overline{A} = \left\{ 4,\ 5 \right\} \rightarrow \Pr\left\{ B \right\} = \frac{n(B)}{n(S)} = \frac{2}{6} = \frac{1}{3}\)
‘홀’을 선택할 확률 \(\frac{2}{3}\), ‘짝’을 선택할 확률 \(\frac{1}{3}\)
혼합전략과 합리화전략
최적 대응(Best Response)
경기자 \(i\)를 제외한 다른 경기자 \(- i\)의 전략이 주어졌을 때, 경기자 \(i\)의 다른 모든 전략보다 ‘크거나 같은’ 보수를 주는 전략
경기자 \(i\)의 전략 \(\widehat{\sigma_{i}}\)는 다른 경기자 \(- i\)의 전략(조합) \(\sigma_{- i}\)에 대한 최적대응 if \(u_{i}\left( \widehat{\sigma_{i}},\ \sigma_{- i} \right) \geq u_{i}\left( \sigma_{i},\ \sigma_{- i} \right) \,\, \forall\sigma_{i} \in S_{i}\)를 만족시키는 \(\sigma_{- i}\)가 존재
예) 홀짝 게임에서 경기자 1의 최적 대응
경기자 2가 ‘홀’을 선택? \(u_{1}\)(짝,홀) \(= 1 \geq u_{1}\)(홀,홀) \(= - 1\)
경기자 2가 ‘짝’을 선택? \(u_{1}\)(홀,짝) \(= 1 \geq u_{1}\)(짝,짝) \(= - 1\)
합리화전략(Rationalizable Strategy)
경기자가 서로 ‘합리적으로 행동할 것이다’라고 가정
다른 경기자의 선택에 최적 대응을 선택하는 것이 합리적!
경기자 \(i\)의 입장에서 ‘합리적’으로 판단할 때, 절대로 선택되지 않을 전략을 제외하고 남은 전략의 집합
혼합전략은 합리화전략의 혼합
\(\rightarrow\) 혼합전략은 합리화전략의 볼록결합(convex combination)
요약
순수전략 내쉬균형은 항상 존재할까?
- 경기자에게 분배되는 보수의 합이 일정하면 그 게임은 순수전략 내쉬균형이 존재하지 않음
혼합전략에서 어떤 전략이 선택될지 알 수 있을까?
- 사전적으로는 알 수 없으며, 경향성 추정만 가능
합리화전략과 혼합전략 사이의 관계는 무엇일까?
- 혼합전략은 합리화전략의 볼록결합
2. 혼합전략 내쉬균형
학습목표
다음 질문에 대해 답을 할 수 있다.
혼합전략의 확률분포는 어떻게 정의될까?
혼합전략의 기대보수는 어떻게 계산해야 할까?
홀짝 게임의 혼합전략 내쉬균형은 무엇일까?
다음 문제를 생각해보자.
혼합전략 내쉬균형은 항상 존재할까?
기대보수 이외의 다른 기준은 없을까?
★ 핵심만 쏙쏙!
혼합전략 내쉬균형은 선택할 확률이 바뀌지 않는 확률분포
확률분포와 기대보수
홀짝 게임(Matching Pennies)
경기자: 각각 여러 개의 동전을 가진 두 경기자
전략 집합: {홀, 짝}
보수표
홀짝 게임에서 경기자 1의 확률분포
\(p\): 경기자 1이 ‘홀’을 선택할 확률
\(1 - p\): 경기자 1이 ‘짝’을 선택할 확률
홀짝 게임에서 경기자 1의 혼합전략
\(p = 0\): 경기자 1이 확정적으로 ‘짝’을 선택
\(p = \frac{1}{3}\): {홀, 짝, 짝} 주머니에서 임의로 제비를 뽑아 선택
\(p = \frac{2}{3}\): {홀, 홀, 짝} 주머니에서 임의로 제비를 뽑아 선택
\(p = 1\): 경기자 1이 확정적으로 ‘홀’을 선택
경기자 1의 확률분포를 고려한 경기자 2의 기대보수
경기자 2가 ‘홀’을 선택하면?
\[\begin{align} E\left\lbrack u_{2}( \cdot ,\text{홀}) \right\rbrack & = p \times u_{2}(\text{홀},\text{홀}) + (1 - p) \times u_{2}(\text{짝},\text{홀}) \\ & = p \times (1) + (1 - p) \times ( - 1) = 2p - 1 \end{align}\]경기자 2가 ‘짝’을 선택하면?
\[\begin{align} E\left\lbrack u_{2}( \cdot ,\text{짝}) \right\rbrack & = p \times u_{2}(\text{홀},\text{짝}) + (1 - p) \times u_{2}(\text{짝},\text{짝}) \\ & = p \times ( - 1) + (1 - p) \times (1) = 1 - 2p \end{align}\]
기대보수에 따른 대응곡선
경기자 2의 기대보수를 고려한 최적 대응
경기자 1의 확률분포:
\(\Pr \left\{ \text{홀} \right\} = p\), \(\Pr \left\{ \text{짝} \right\} = 1 - p\)
경기자 2의 기대보수
\(E\left\lbrack u_{2}( \cdot ,\text{홀}) \right\rbrack = 2p - 1\), \(E\left\lbrack u_{2}( \cdot ,\text{짝}) \right\rbrack = 1 - 2p\)
경기자 2의 확률분포:
\(\Pr \left\{ \text{홀} \right\} = q\), \(\Pr \left\{ \text{짝} \right\} = 1 - q\)
- \[\begin{align} E\left\lbrack u_{2}( \cdot ,\text{홀}) \right\rbrack > E\left\lbrack u_{2}( \cdot ,\text{짝}) \right\rbrack & \Leftrightarrow p > \frac{1}{2} \rightarrow q = 1 \\ E\left\lbrack u_{2}( \cdot ,\text{홀}) \right\rbrack = E\left\lbrack u_{2}( \cdot ,\text{짝}) \right\rbrack & \Leftrightarrow p = \frac{1}{2} \rightarrow any \,\, q \in \lbrack 0,\ 1\rbrack \\ E\left\lbrack u_{2}( \cdot ,\text{홀}) \right\rbrack < E\left\lbrack u_{2}( \cdot ,\text{짝}) \right\rbrack & \Leftrightarrow p < \frac{1}{2} \rightarrow q = 0 \end{align}\]
경기자 2의 대응곡선
- \[\begin{align} E\left\lbrack u_{2}( \cdot ,\text{홀}) \right\rbrack > E\left\lbrack u_{2}( \cdot ,\text{짝}) \right\rbrack & \Leftrightarrow p > \frac{1}{2} \rightarrow q = 1 \\ E\left\lbrack u_{2}( \cdot ,\text{홀}) \right\rbrack = E\left\lbrack u_{2}( \cdot ,\text{짝}) \right\rbrack & \Leftrightarrow p = \frac{1}{2} \rightarrow any \,\, q \in \lbrack 0,\ 1\rbrack \\ E\left\lbrack u_{2}( \cdot ,\text{홀}) \right\rbrack < E\left\lbrack u_{2}( \cdot ,\text{짝}) \right\rbrack & \Leftrightarrow p < \frac{1}{2} \rightarrow q = 0 \end{align}\]
- \[\begin{align} E\left\lbrack u_{2}( \cdot ,\text{홀}) \right\rbrack > E\left\lbrack u_{2}( \cdot ,\text{짝}) \right\rbrack & \Leftrightarrow p > \frac{1}{2} \rightarrow q = 1 \\ E\left\lbrack u_{2}( \cdot ,\text{홀}) \right\rbrack = E\left\lbrack u_{2}( \cdot ,\text{짝}) \right\rbrack & \Leftrightarrow p = \frac{1}{2} \rightarrow any \,\, q \in \lbrack 0,\ 1\rbrack \\ E\left\lbrack u_{2}( \cdot ,\text{홀}) \right\rbrack < E\left\lbrack u_{2}( \cdot ,\text{짝}) \right\rbrack & \Leftrightarrow p < \frac{1}{2} \rightarrow q = 0 \end{align}\]
경기자 1의 기대보수를 고려한 최적 대응
경기자 2의 확률분포:
\(\Pr \left\{ \text{홀} \right\} = q\), \(\Pr \left\{ \text{짝} \right\} = 1 - q\)
경기자 1의 기대보수
\(E\left\lbrack u_{1}(\text{홀}, \cdot ) \right\rbrack = 1 - 2q\), \(E\left\lbrack u_{1}(\text{짝}, \cdot ) \right\rbrack = 2q - 1\)
경기자 1의 확률분포:
\(\Pr \left\{ \text{홀} \right\} = p\), \(\Pr \left\{ \text{짝} \right\} = 1 - p\)
- \[\begin{align} E\left\lbrack u_{1}(\text{홀}, \cdot ) \right\rbrack > E\left\lbrack u_{1}(\text{짝}, \cdot ) \right\rbrack & \Leftrightarrow q < \frac{1}{2} \rightarrow p = 1 \\ E\left\lbrack u_{1}(\text{홀}, \cdot ) \right\rbrack = E\left\lbrack u_{1}(\text{짝}, \cdot ) \right\rbrack & \Leftrightarrow q = \frac{1}{2} \rightarrow any \,\, p \in \lbrack 0,\ 1\rbrack \\ E\left\lbrack u_{1}(\text{홀}, \cdot ) \right\rbrack < E\left\lbrack u_{1}(\text{짝}, \cdot ) \right\rbrack & \Leftrightarrow q > \frac{1}{2} \rightarrow p = 0 \end{align}\]
경기자 1의 대응 곡선
- \[\begin{align} E\left\lbrack u_{1}(\text{홀}, \cdot ) \right\rbrack > E\left\lbrack u_{1}(\text{짝}, \cdot ) \right\rbrack & \Leftrightarrow q < \frac{1}{2} \rightarrow p = 1 \\ E\left\lbrack u_{1}(\text{홀}, \cdot ) \right\rbrack = E\left\lbrack u_{1}(\text{짝}, \cdot ) \right\rbrack & \Leftrightarrow q = \frac{1}{2} \rightarrow any \,\, p \in \lbrack 0,\ 1\rbrack \\ E\left\lbrack u_{1}(\text{홀}, \cdot ) \right\rbrack < E\left\lbrack u_{1}(\text{짝}, \cdot ) \right\rbrack & \Leftrightarrow q > \frac{1}{2} \rightarrow p = 0 \end{align}\]
- \[\begin{align} E\left\lbrack u_{1}(\text{홀}, \cdot ) \right\rbrack > E\left\lbrack u_{1}(\text{짝}, \cdot ) \right\rbrack & \Leftrightarrow q < \frac{1}{2} \rightarrow p = 1 \\ E\left\lbrack u_{1}(\text{홀}, \cdot ) \right\rbrack = E\left\lbrack u_{1}(\text{짝}, \cdot ) \right\rbrack & \Leftrightarrow q = \frac{1}{2} \rightarrow any \,\, p \in \lbrack 0,\ 1\rbrack \\ E\left\lbrack u_{1}(\text{홀}, \cdot ) \right\rbrack < E\left\lbrack u_{1}(\text{짝}, \cdot ) \right\rbrack & \Leftrightarrow q > \frac{1}{2} \rightarrow p = 0 \end{align}\]
대응곡선과 혼합전략 내쉬균형
혼합전략 내쉬균형(Mixed Strategy Nash Equilibrium)
두 경기자 모두에게 최적 대응인 \(p^{*}\)와 \(q^{*}\)를 결정
두 대응곡선이 교차하는 점이 혼합전략 내쉬균형
홀짝 게임의 혼합전략 내쉬균형
경기자 1: ‘홀’ 선택 확률 \(p^{*} = \frac{1}{2}\), ‘짝’ 선택 확률 \(1 - p^{*} = \frac{1}{2}\)
경기자 2: ‘홀’ 선택 확률 \(q^{*} = \frac{1}{2}\), ‘짝’ 선택 확률 \(1 - q^{*} = \frac{1}{2}\)
홀짝 게임의 혼합전략 내쉬균형 해석
경기자 1: ‘홀’ 선택 확률 \(p^{*} = \frac{1}{2}\), ‘짝’ 선택 확률 \(1 - p^{*} = \frac{1}{2}\)
{홀, 짝} 제비가 같은 비율로 섞인 주머니에서 무작위로 하나의 제비를 추출하여 제비에 적힌 대로 실행
경기자 2: ‘홀’ 선택 확률 \(q^{*} = \frac{1}{2}\), ‘짝’ 선택 확률 \(1 - q^{*} = \frac{1}{2}\)
‘제대로 만들어진’ 동전을 던져서 ‘앞면’이 나오면 ‘홀’, ‘뒷면’이 나오면 ‘짝’을 선택
순수전략의 조합 (홀, 홀); (홀, 짝); (짝, 홀); (짝, 짝)이 각각 \(\frac{1}{4}\)의 확률로 실현될 것!
네 가지 순수전략의 조합 중에서 무엇이 실현될지는 사전적으로 알 수 없음
혼합전략 내쉬균형에서, 선택가능한 전략 조합은 같은 수준의 기대보수(홀짝 게임에서는 ‘0’)를 제공
요약
혼합전략의 확률분포는 어떻게 정의될까?
각각의 순수전략(합리화전략)을 선택할 확률
확률분포를 정의하는 것이 경기자의 전략 집합
혼합전략의 기대보수는 어떻게 계산해야 할까?
- 상대의 확률분포를 기준으로 보수의 기댓값 계산
홀짝 게임의 혼합전략 내쉬균형은 무엇일까?
- ‘홀’과 ‘짝’을 각각 \(\frac{1}{2}\)의 확률로 무작위하게 선택
3. 혼합전략 내쉬균형의 적용
학습목표
다음 질문에 대해 답을 할 수 있다.
가위바위보 게임은 순수전략 내쉬균형이 존재할까?
가위바위보 게임의 혼합전략 내쉬균형은 무엇일까?
가위바위 게임의 혼합전략 내쉬균형은 어떻게 구현할까?
다음 문제를 생각해보자.
혼합전략으로 설명될 수 있는 상황은 무엇일까?
현실 상황에서 혼합전략 내쉬균형의 의미는?
★ 핵심만 쏙쏙!
혼합전략 내쉬균형은 기대보수를 같게 하는 확률분포
가위바위보 게임의 순수전략 균형
가위바위보 게임(Rock-Paper-Scissors Game)
경기자: 두 경기자(경기자 1, 경기자 2)
전략 집합: {가위, 바위, 보}
보수표
가위바위보 게임(Rock-Paper-Scissors Game)
우월전략, 열등전략 모두 없음
9가지 전략조합이 균형이 될 수 있는지 판단 필요
전략조합 1: (가위, 가위)
경기자 1: \(u_{1}\)(가위,가위) \(= 0 < u_{1}\)(바위,가위) \(= 1\)
경기자 2: \(u_{2}\)(가위,가위) \(= 0 < u_{2}\)(가위,바위) \(= 1\)
전략조합 2: (가위, 바위)
경기자 1: \(u_{1}\)(가위,바위) \(= - 1 < u_{1}\)(바위,바위) \(= 0\)
경기자 2: \(u_{2}\)(가위,바위) \(= 1 \geq u_{2}\)(가위,가위) \(= 0\)
\(\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,u_{2}\)(가위,바위) \(= 1 \geq u_{2}\)(가위,보) \(= - 1\)
전략조합 3: (가위, 보)
경기자 1: \(u_{1}\)(가위,보) \(= 1 \geq u_{1}\)(바위,보) \(= - 1\)
\(\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,u_{1}\)(가위,보) \(= 1 \geq u_{1}\)(보,보) \(= 0\)
경기자 2: \(u_{2}\)(가위,보) \(= - 1 < u_{2}\)(가위,바위) \(= 1\)
전략조합 4: (바위, 가위)
경기자 1: \(u_{1}\)(바위,가위) \(= 1 \geq u_{1}\)(가위,가위) \(= 0\)
\(\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,u_{1}\)(바위,가위) \(= 1 \geq u_{1}\)(보,가위) \(= - 1\)
경기자 2: \(u_{2}\)(바위,가위) \(= - 1 < u_{2}\)(바위,바위) \(= 0\)
전략조합 5: (바위, 바위)
경기자 1: \(u_{1}\)(바위,바위) \(= 0 < u_{1}\)(보,바위) \(= 1\)
경기자 2: \(u_{2}\)(바위,바위) \(= 0 < u_{2}\)(바위,보) \(= 1\)
전략조합 6: (바위, 보)
경기자 1: \(u_{1}\)(바위,보) \(= - 1 < u_{1}\)(가위,보) \(= 1\)
경기자 2: \(u_{2}\)(바위,보) \(= 1 \geq u_{2}\)(바위,가위) \(= - 1\)
\(\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,u_{2}\)(바위,보) \(= 1 \geq u_{2}\)(바위,바위) \(= 0\)
전략조합 7: (보, 가위)
경기자 1: \(u_{1}\)(보,가위) \(= - 1 < u_{1}\)(가위,가위) \(= 0\)
경기자 2: \(u_{2}\)(보,가위) \(= 1 \geq u_{2}\)(보,바위) \(= - 1\)
\(\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,u_{2}\)(보,가위) \(= 1 \geq u_{2}\)(보,보) \(= 0\)
전략조합 8: (보, 바위)
경기자 1: \(u_{1}\)(보,바위) \(= 1 \geq u_{1}\)(가위,바위) \(= - 1\)
\(\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,u_{1}\)(보,바위) \(= 1 \geq u_{1}\)(바위,바위) \(= 0\)
경기자 2: \(u_{2}\)(보,바위) \(= - 1 < u_{2}\)(보,가위) \(= 1\)
전략조합 9: (보, 보)
경기자 1: \(u_{1}\)(보,보) \(= 0 < u_{1}\)(가위,보) \(= 1\)
경기자 2: \(u_{2}\)(보,보) \(= 0 < u_{2}\)(보,가위) \(= 1\)
가위바위보 게임
순수전략 내쉬균형 없음
약열등전략의 단계적 소거로 제외되는 전략 없음
가위바위보 게임의 혼합전략 균형
가위바위보 게임에서 경기자 1의 확률분포
\(p\): 경기자 1이 ‘가위’를 선택할 확률
\(q\): 경기자 1이 ‘바위’를 선택할 확률
\(1 - p - q\): 경기자 1이 ‘보’를 선택할 확률
가위바위보 게임에서 경기자 1의 혼합전략
\(p = 1,\ q = 0\) : 경기자 1이 확정적으로 ‘가위’를 선택
\(p = \frac{1}{3},\ q = \frac{1}{3}\) : {가위, 바위, 보}에서 제비를 뽑아 선택
\(p = \frac{2}{3},\ q = \frac{1}{3}\): {가위, 가위, 바위}에서 제비를 뽑아 선택
\(p = 0,q = 0\): 경기자 1이 확정적으로 ‘보’를 선택
경기자 1의 확률분포를 고려한 경기자 2의 기대보수
경기자 2가 ‘가위’를 선택하면?
\[\begin{align} E\left\lbrack u_{2}( \cdot , \text{가위}) \right\rbrack & = p \times u_{2}(\text{가위},\text{가위}) \\ & + q \times u_{2}(\text{바위}, \text{가위}) \\ & + (1 - p - q) \times u_{2}(\text{보},\text{가위}) \\ & = p \times (0) + q \times ( - 1) + (1 - p - q) \times (1) \\ & = - p - 2q + 1 \end{align}\]경기자 2가 ‘바위’를 선택하면?
\[\begin{align} E\left\lbrack u_{2}( \cdot , \text{바위}) \right\rbrack & = p \times u_{2}(\text{가위},\text{바위}) \\ & + q \times u_{2}(\text{바위}, \text{바위}) \\ & + (1 - p - q) \times u_{2}(\text{보},\text{바위}) \\ & = p \times (1) + q \times (0) + (1 - p - q) \times ( - 1) \\ & = 2p + q - 1 \end{align}\]경기자 2가 ‘보’를 선택하면?
\[\begin{align} E\left\lbrack u_{2}( \cdot , \text{보}) \right\rbrack & = p \times u_{2}(\text{가위},\text{보}) \\ & + q \times u_{2}(\text{바위}, \text{보}) \\ & + (1 - p - q) \times u_{2}(\text{보},\text{보}) \\ & = p \times ( - 1) + q \times (1) + (1 - p - q) \times (0) \\ & = - p + q \end{align}\]
경기자 2의 기대보수를 같게 하는 경기자 1의 확률분포
(경기자 2가 ‘가위’를 선택할 때 기대보수)
\(=\) (경기자 2가 ‘바위’를 선택할 때 기대보수)
\(=\) (경기자 2가 ‘보’를 선택할 때 기대보수)
가위바위보 게임의 혼합전략 내쉬균형 해석
경기자 1:
‘가위’ 선택 확률 \(p^{*} = \frac{1}{3}\)
‘바위’ 선택 확률 \(q^{*} = \frac{1}{3}\)
‘보’ 선택 확률 \(1 - p^{*} - q^{*} = \frac{1}{3}\)
{가위, 바위, 보} 제비가 같은 비율로 섞인 주머니에서 무작위로 하나의 제비를 추출하여 제비에 적힌 대로 실행
보수표가 대칭이므로, 경기자 2의 확률도 동일
순수전략의 조합
(가위, 가위); (가위, 바위); (가위, 보);
(바위, 가위); (바위, 바위); (바위, 보);
(보, 가위); (보, 바위); (보, 보)가 각각 \(\frac{1}{9}\) 확률로 실현
9가지 순수전략의 조합 중에서 무엇이 실현될지는 사전적으로 알 수 없음
혼합전략 내쉬균형에서, 선택가능한 전략 조합은 같은 수준의 기대보수(가위바위보 게임에서는 ‘0’)를 제공
요약
가위바위보 게임은 순수전략 내쉬균형이 존재할까?
순수전략 내쉬균형이 존재하지 않음
모든 순수전략 조합에서 전략을 바꿀 유인이 존재
가위바위보 게임의 혼합전략 내쉬균형은 무엇일까?
- ‘가위’, ‘바위’, ‘보’을 각각 \(\frac{1}{3}\) 확률로 무작위 선택
가위바위보 게임의 혼합전략 내쉬균형은 어떻게 구현할까?
- 같은 비율로 섞인 제비, 삼등분 주사위 등
정리하기
순수전략 내쉬균형이 존재하지 않는 게임도 존재
혼합전략은 합리화전략(순수전략)이 선택될 확률의 분포를 부여한 전략
혼합전략 내쉬균형을 따르면, 사전적으로 계산되는 경기자의 기대보수는 같은 수준에서 결정