Aula 22 — Introdução à Teoria de Jogos
Até agora, cada decisor foi analisado em isolamento:
Mas e quando o resultado de cada agente depende das escolhas dos outros?
Important
Em oligopólio, duas ou três empresas controlam o mercado. A decisão de uma afecta directamente o lucro das outras. Cada empresa precisa de antecipar o comportamento das rivais — e elas sabem disso.
A teoria de jogos é a ferramenta adequada para analisar estas situações de interdependência estratégica.
Todo o jogo em forma normal é definido por três elementos:
1. Jogadores — quem decide? (\(i = 1, 2, \ldots, n\))
2. Estratégias — que acções estão disponíveis a cada jogador?
\[S_i = \{s_{i1},\ s_{i2},\ \ldots\}\]
3. Payoffs — que resultado obtém cada jogador para cada combinação de estratégias?
\[\pi_i(s_1, s_2, \ldots, s_n)\]
Note
O payoff pode representar lucro, utilidade, anos de prisão evitados, ou qualquer medida de bem-estar relevante. A teoria é geral — o conteúdo depende da aplicação.
Com dois jogadores e duas estratégias cada, o jogo representa-se numa matriz \(2\times2\):
| Empresa B: \(s_{B1}\) | Empresa B: \(s_{B2}\) | |
|---|---|---|
| Empresa A: \(s_{A1}\) | \((\pi_A^{11},\ \pi_B^{11})\) | \((\pi_A^{12},\ \pi_B^{12})\) |
| Empresa A: \(s_{A2}\) | \((\pi_A^{21},\ \pi_B^{21})\) | \((\pi_A^{22},\ \pi_B^{22})\) |
Convenção: cada célula mostra \((\pi_A,\ \pi_B)\) — primeiro o payoff da empresa que escolhe a linha, segundo o da coluna.
Note
Definição: A estratégia \(s_i\) domina estritamente \(s_i'\) se, independentemente do que os outros jogadores fizerem, \(s_i\) dá sempre um payoff estritamente superior a \(s_i'\).
Se existe uma estratégia dominante para um jogador, um agente racional nunca escolhe a estratégia dominada — independentemente das suas crenças sobre os rivais.
Eliminação iterada de estratégias dominadas:
Se este processo conduz a uma única célula, temos um equilíbrio em estratégias dominantes.
Considere o seguinte jogo:
| Jogador B: \(s_{B1}\) | Jogador B: \(s_{B2}\) | |
|---|---|---|
| Jogador A: \(s_{A1}\) | \((3, 2)\) | \((4, 1)\) |
| Jogador A: \(s_{A2}\) | \((1, 3)\) | \((2, 4)\) |
1. Análise do Jogador A: - Se B joga \(s_{B1}\): \(3 > 1 \Rightarrow s_{A1}\) é melhor. - Se B joga \(s_{B2}\): \(4 > 2 \Rightarrow s_{A1}\) é melhor. - \(\therefore s_{A1}\) domina estritamente \(s_{A2}\). O Jogador A eliminará \(s_{A2}\).
2. Análise do Jogador B (após a eliminação de \(s_{A2}\)): - Sabendo que A jogará \(s_{A1}\), o Jogador B compara os seus payoffs na primeira linha: \(2 > 1\). - \(\therefore s_{B1}\) é a melhor resposta ao jogar \(s_{A1}\).
Resultado IEDS: O jogo converge para o perfil de estratégias \((s_{A1}, s_{B1})\).
Important
Definição (John Nash, 1950): Um perfil de estratégias \((s_1^*, s_2^*, \ldots, s_n^*)\) é um Equilíbrio de Nash se nenhum jogador tem incentivo a desviar-se unilateralmente, dado que os outros mantêm as suas estratégias.
Formalmente, para cada jogador \(i\):
\[\pi_i(s_i^*,\ s_{-i}^*) \geq \pi_i(s_i,\ s_{-i}^*) \quad \forall s_i\]
onde \(s_{-i}^*\) denota as estratégias de todos os outros jogadores.
Note
O Equilíbrio de Nash é um conceito de consistência mútua: cada jogador está a fazer o melhor que pode dado o que os outros estão a fazer. Ninguém se arrepende da sua escolha a posteriori.
Um Equilíbrio de Nash não é necessariamente o melhor resultado colectivo:
Esta tensão entre racionalidade individual e óptimo colectivo é o coração do Dilema do Prisioneiro.
Dois suspeitos são detidos e interrogados separadamente. Cada um pode:
| Suspeito B: Calar | Suspeito B: Confessar | |
|---|---|---|
| Suspeito A: Calar | \((4, 4)\) | \((0, 5)\) |
| Suspeito A: Confessar | \((5, 0)\) | \((1, 1)\) |
(payoffs = anos de prisão evitados — maior é melhor)
Raciocínio de A:
Confessar domina estritamente Calar — para A. Pelo mesmo raciocínio, também para B.
Equilíbrio de Nash: (Confessar, Confessar) = (1, 1)
Important
Mas (Calar, Calar) = (4, 4) é Pareto superior — ambos ficariam melhor se calassem. O problema: nenhum consegue credibilmente comprometer-se a calar sem que o outro aproveite para confessar.
A racionalidade individual leva a um resultado colectivamente mau.
O dilema do prisioneiro tem uma aplicação directa à política de concorrência:
Duas empresas num cartel podem:
| Empresa B: Cooperar | Empresa B: Delatar | |
|---|---|---|
| Empresa A: Cooperar | \((6, 6)\) | \((0, 8)\) |
| Empresa A: Delatar | \((8, 0)\) | \((2, 2)\) |
(payoffs em milhares de euros de lucro líquido)
Dominância de Delatar:
Equilíbrio de Nash: (Delatar, Delatar) = (2, 2)
Resultado colectivamente inferior a (Cooperar, Cooperar) = (6, 6).
Tip
Lógica da política de leniência: os reguladores exploram exactamente esta estrutura. Ao oferecer imunidade total ao primeiro a delatar, tornam a delação ainda mais atractiva — o equilíbrio de Nash desloca-se para (Delatar, Delatar) de forma ainda mais robusta.
Os cartéis são instáveis precisamente porque cada membro tem incentivo a trair os parceiros.
Nem todos os jogos têm a estrutura problemática do dilema do prisioneiro:
| Jogador B: Esquerda | Jogador B: Direita | |
|---|---|---|
| Jogador A: Esquerda | \((3, 3)\) | \((0, 0)\) |
| Jogador A: Direita | \((0, 0)\) | \((3, 3)\) |
(Exemplo: lados de circulação no trânsito)
Dois Equilíbrios de Nash: (Esq, Esq) e (Dir, Dir). Aqui o problema não é a traição — é a coordenação: ambos querem fazer o mesmo, mas qual?
| Conceito | Definição em síntese |
|---|---|
| Estratégia dominante | Melhor resposta independentemente do rival |
| Estratégia dominada | Nunca é a melhor resposta — racional eliminá-la |
| Equilíbrio de Nash | Ninguém quer desviar unilateralmente |
| Dilema do Prisioneiro | EN existe mas é Pareto inferior — racionalidade individual \(\neq\) óptimo colectivo |
| Jogo de coordenação | Múltiplos EN — o problema é coordenar, não trair |
Note
Na próxima aula aplicamos estes conceitos ao oligopólio: o modelo de Cournot é precisamente um jogo em que cada empresa escolhe quantidade tomando a rival como dado — e o equilíbrio de Nash em quantidades é o resultado central.
Considere a seguinte matriz de payoffs \((\pi_A,\ \pi_B)\):
| Empresa B: Alto | Empresa B: Baixo | |
|---|---|---|
| Empresa A: Alto | \((3, 3)\) | \((1, 5)\) |
| Empresa A: Baixo | \((5, 1)\) | \((2, 2)\) |
O Equilíbrio de Nash desta matriz é:
A: Se B=Alto: \(5 > 3\) → Baixo. Se B=Baixo: \(2 > 1\) → Baixo. Baixo domina.
B: Se A=Alto: \(5 > 3\) → Baixo. Se A=Baixo: \(2 > 1\) → Baixo. Baixo domina.
Nash: (Baixo, Baixo) = (2, 2) — nenhum quer desviar unilateralmente.
Note: (Alto, Alto) = (3, 3) é Pareto superior mas não é EN — cada um tem incentivo a desviar para Baixo.
Resposta: (c)
No Dilema do Prisioneiro, o Equilíbrio de Nash é:
Resposta: (b)
Duas empresas, A e B, participavam num cartel ilegal. A autoridade da concorrência abre uma investigação e contacta cada empresa separadamente, oferecendo imunidade total à primeira a colaborar.
Cada empresa pode Cooperar (manter silêncio) ou Delatar (colaborar com a autoridade).
Os payoffs (lucro líquido esperado, em milhares de euros) são:
| Empresa B: Cooperar | Empresa B: Delatar | |
|---|---|---|
| Empresa A: Cooperar | \((6, 6)\) | \((0, 8)\) |
| Empresa A: Delatar | \((8, 0)\) | \((2, 2)\) |
a) Verificação da dominância de Delatar para A:
Delatar é estritamente dominante — A prefere Delatar independentemente da escolha de B. ✓
b) Pelo mesmo raciocínio (o jogo é simétrico), Delatar também domina para B.
Equilíbrio de Nash: (Delatar, Delatar) = (2, 2)
Nenhuma empresa quer desviar: se A está a delatar, B obtém \(2\) (delatar) \(>\) \(0\) (cooperar). ✓
c) O resultado colectivamente óptimo é (Cooperar, Cooperar) = (6, 6) — soma de payoffs \(12 > 4\).
Mas não é sustentável: qualquer empresa tem incentivo a desviar unilateralmente para Delatar e obter \(8\) em vez de \(6\).
d) A política de leniência reforça exactamente esta estrutura. Ao garantir imunidade ao primeiro a delatar, o regulador torna o payoff de Delatar ainda mais atractivo. Cada empresa sabe que a rival tem incentivo a delatar primeiro — o que acelera a delação mútua. O cartel dissolve-se pela mesma lógica do dilema do prisioneiro: a racionalidade individual destrói a colusão colectiva.
Microeconomia (Plano de Transição)