Microeconomia
Aula 25 — Bertrand, Colusão e Jogos Repetidos
1 O Modelo de Bertrand
1.1 Uma Pergunta Simples
Em Cournot, duas empresas com \(Cmg = 6\) e procura \(P = 30 - Q\) obtêm:
\[Q_C = 16,\quad P_C = 14,\quad \Pi_C = 64 \text{ cada}\]
. . .
E se, em vez de escolherem quantidades, as empresas escolhessem preços?
. . .
Esta é a diferença essencial entre Cournot e Bertrand: a variável estratégica. Mesma estrutura de mercado, mesmo número de empresas — resultado radicalmente diferente.
1.2 A Lógica do Undercutting
Com produto homogéneo, consumidores compram sempre à empresa mais barata.
. . .
Suponha que a Empresa B cobra \(P_B = 14\) (preço de Cournot):
- A Empresa A cobra \(P_A = 13{,}99\) — captura todo o mercado e ganha lucro positivo
- B responde com \(P_B = 13{,}98\) — captura todo o mercado de volta
- A responde com \(P_A = 13{,}97\ldots\)
. . .
Este processo — undercutting — só pára quando nenhuma empresa tem incentivo a baixar mais o preço.
. . .
\[P_A = P_B = Cmg = 6\]
Abaixo de \(Cmg\), vender implica prejuízo. Acima de \(Cmg\), a rival subcorta.
1.3 O Paradoxo de Bertrand
Paradoxo de Bertrand: com apenas duas empresas, produto homogéneo e decisões simultâneas de preço, o equilíbrio de Nash é \(P = Cmg\) — o mesmo resultado que concorrência perfeita com infinitas empresas.
. . .
Verificação do Equilíbrio de Nash:
- Se \(P_B = 6 = Cmg\): cobrar \(P_A < 6\) gera prejuízo; cobrar \(P_A > 6\) perde todos os clientes; cobrar \(P_A = 6\) dá lucro zero. Nenhum desvio é rentável. ✓
. . .
\[P^*_{\text{Bert}} = Cmg = 6 \qquad Q^*_{\text{Bert}} = 24 \qquad \Pi^*_{\text{Bert}} = 0\]
1.4 Cournot vs. Bertrand — O que Muda?
| Cournot | Bertrand | |
|---|---|---|
| Variável estratégica | Quantidade | Preço |
| Timing | Simultâneo | Simultâneo |
| Resultado | \(P > Cmg\), \(\Pi > 0\) | \(P = Cmg\), \(\Pi = 0\) |
| Equivalente a | — | Conc. Perfeita |
. . .
O paradoxo levanta uma questão: qual o modelo mais realista? Depende do mercado. Quando as empresas constroem capacidade com antecedência (e depois competem em preço), o resultado aproxima-se de Cournot. Quando podem ajustar a oferta instantaneamente, Bertrand é mais adequado.
1.5 Saídas do Paradoxo
Na prática, o resultado de Bertrand raramente se verifica porque:
- Diferenciação de produto — com produtos diferentes, a empresa que baixa o preço não captura imediatamente todo o mercado; há fidelização
- Capacidade instalada limitada — se a empresa não tem capacidade para servir todo o mercado, o undercutting total não é possível
- Interacção repetida — em mercados com encontros frequentes, a ameaça de represália pode sustentar preços acima de \(Cmg\)
. . .
Este último ponto — a interacção repetida — é o tema da segunda parte desta aula. A repetição transforma o jogo e pode sustentar resultados que não seriam possíveis num jogo de uma só vez.
2 Colusão e o Incentivo a Desviar
2.1 O Sonho do Cartel
Se as empresas pudessem coordenar os preços, agiriam como um monopolista:
\[Q_m = 12,\quad P_m = 18,\quad \Pi_m = 144 \quad\Rightarrow\quad \Pi_{\text{cada}} = 72\]
. . .
Comparando com Bertrand (\(\Pi = 0\)) e Cournot (\(\Pi = 64\)), a colusão maximiza o lucro conjunto.
. . .
Mas cada empresa tem incentivo a desviar:
. . .
Se B mantém o preço de cartel \(P_B = 18\), A pode cobrar \(P_A = 17{,}99\) e capturar todo o mercado, obtendo \(\Pi_A \approx 144\) em vez de \(72\).
. . .
Estrutura de Dilema do Prisioneiro (já conhecida da Aula 22): o resultado colectivamente óptimo (cooperar) não é sustentável num jogo de uma só vez porque cada empresa tem incentivo a desviar unilateralmente.
2.2 Matriz do Jogo de Preços (Uma Vez)
. . .
Desviar domina Colusão (num jogo de uma só vez): \(144 > 72\) se o outro coopera; \(0 = 0\) se o outro desvia.
EN: (Desviar, Desviar) = (0, 0) — mesma estrutura do dilema do prisioneiro. ✓
3 Jogos Repetidos e Colusão Sustentável
3.1 A Repetição Muda o Jogo
Num mercado real, as empresas interagem repetidamente — todos os meses, todos os anos.
. . .
A repetição introduz um elemento novo: a ameaça de represália futura.
. . .
- Se A desviar hoje, B pune A amanhã (e depois, e sempre)
- A punição reduz os lucros futuros de A
- Se A valorizar suficientemente o futuro, a ameaça de punição pode impedir o desvio
. . .
O jogo repetido não elimina o incentivo a desviar num único período — mas cria um trade-off inter-temporal: ganho imediato de desviar vs. perda de lucros futuros pela punição.
3.2 O Factor de Desconto \(\delta\)
\(\delta \in (0,1)\) é o factor de desconto — mede quanto a empresa valoriza \(1\) euro de lucro no próximo período em comparação com \(1\) euro hoje.
. . .
- \(\delta\) próximo de \(1\): empresa muito paciente — valoriza muito o futuro
- \(\delta\) próximo de \(0\): empresa impaciente — quase só valoriza o presente
. . .
O valor presente de um fluxo constante \(\Pi\) por período, para sempre:
\[NPV = \Pi + \delta\Pi + \delta^2\Pi + \ldots = \frac{\Pi}{1-\delta}\]
. . .
\(\delta\) pode interpretar-se como \(\dfrac{1}{1+r}\) onde \(r\) é a taxa de juro, ou como a probabilidade de o jogo continuar no próximo período.
3.3 Estratégia Grim Trigger
A estratégia mais simples que pode sustentar a colusão:
. . .
Grim Trigger (gatilho implacável):
- Cooperar (cobrar \(P_m\)) enquanto o rival cooperar
- Se o rival desviar alguma vez: punir para sempre — cobrar \(P = Cmg\) (Bertrand) eternamente
. . .
Esta estratégia é simples e credível: uma vez activada a punição, jogar Bertrand é óptimo para ambas as empresas (é o EN do jogo estático). A ameaça é credível porque não requer que ninguém “sacrifique” lucros para punir.
3.4 Condição de Sustentabilidade da Colusão
Empresa A compara dois cenários:
. . .
Cooperar sempre (recebe \(\Pi_{coop}\) por período):
\[NPV_{\text{coop}} = \frac{\Pi_{coop}}{1-\delta}\]
. . .
Desviar hoje (recebe \(\Pi_{dev}\) hoje, depois punição \(\Pi_N = 0\) para sempre):
\[NPV_{dev} = \Pi_{dev} + \frac{\delta \cdot 0}{1-\delta} = \Pi_{dev}\]
. . .
Colusão sustentável se \(NPV_{\text{coop}} \geq NPV_{dev}\):
\[\frac{\Pi_{coop}}{1-\delta} \geq \Pi_{dev} \quad\Leftrightarrow\quad \delta \geq 1 - \frac{\Pi_{coop}}{\Pi_{dev}}\]
3.5 Derivação do \(\delta\) Mínimo
Com \(\Pi_{coop} = 72\) e \(\Pi_{dev} = 144\):
\[\frac{72}{1-\delta} \geq 144\]
. . .
\[72 \geq 144(1-\delta)\]
. . .
\[144\delta \geq 144 - 72 = 72\]
. . .
\[\boxed{\delta \geq \frac{1}{2}}\]
. . .
Se \(\delta \geq \tfrac{1}{2}\), a colusão é sustentável com grim trigger. Se \(\delta < \tfrac{1}{2}\), a empresa prefere desviar hoje — o futuro não pesa suficientemente para disciplinar o comportamento presente.
3.6 Interpretação Económica de \(\delta \geq \frac{1}{2}\)
. . .
Quanto maior \(\delta\) (mais paciente a empresa), maior \(NPV_{\text{coop}}\) — o fluxo futuro de lucros de colusão vale mais. Para \(\delta = \tfrac{1}{2}\): \(NPV_{\text{coop}} = \tfrac{72}{1/2} = 144 = NPV_{dev}\) — a empresa é indiferente.
3.7 Quando é a Colusão Mais Provável?
A condição \(\delta \geq \tfrac{1}{2}\) é mais fácil de satisfazer quando:
- Taxas de juro baixas — \(\delta = 1/(1+r)\) é maior quando \(r\) é pequeno; o futuro desconta menos
- Mercado estável e de longa duração — horizon longo aumenta o valor dos lucros futuros
- Interacções frequentes — empresas que se encontram frequentemente têm mais oportunidades de punir desvios rapidamente
- Poucos participantes — é mais fácil monitorizar o comportamento das rivais e detectar desvios
- Lucro de desvio relativamente pequeno — se \(\Pi_{dev}/\Pi_{coop}\) for baixo, o \(\delta\) necessário é menor
. . .
Implicação para a política de concorrência: os reguladores monitorizam especialmente mercados concentrados, estáveis e com interacções frequentes — precisamente onde a colusão tácita é mais fácil de sustentar.
3.8 Tabela Final: Todas as Estruturas
| Estrutura | \(Q\) | \(P\) | \(\Pi\) cada | Eficiência |
|---|---|---|---|---|
| Monopólio/Cartel | \(12\) | \(18\) | \(72\) | Mínima |
| Stackelberg | \(18\) | \(12\) | \(72\ /\ 36\) | — |
| Cournot | \(16\) | \(14\) | \(64\) | Intermédia |
| Bertrand | \(24\) | \(6\) | \(0\) | Máxima |
| Conc. Perfeita | \(24\) | \(6\) | \(0\) | Máxima |
. . .
Bertrand com produto homogéneo e custos idênticos reproduz exactamente o resultado de concorrência perfeita — com apenas duas empresas. A variável estratégica importa tanto quanto o número de concorrentes.
4 Exercícios
4.1 Exercício 1 — Escolha Múltipla
Duas empresas com produto homogéneo e \(Cmg = 10\) competem em preços (Bertrand). O equilíbrio de Nash é:
- \(P = 10\), \(\Pi = 0\) para cada empresa
- \(P > 10\), com lucros positivos para ambas
- Uma empresa cobra \(P > 10\) e a outra cobra \(P = 10\)
- Depende da procura — não há solução geral
4.2 Solução — Exercício 1
A lógica de undercutting: qualquer \(P > Cmg = 10\) é instável — a rival tem incentivo a cobrar \(P - \varepsilon\) e capturar todo o mercado.
O processo pára em \(P = Cmg = 10\): abaixo, há prejuízo; acima, a rival subcorta.
Resposta: (a)
Verificação Nash: se \(P_B = 10\), cobrar \(P_A < 10\) gera prejuízo; cobrar \(P_A > 10\) perde clientes; cobrar \(P_A = 10\) dá \(\Pi = 0\). Nenhum desvio é estritamente rentável. ✓
4.3 Exercício 2 — Escolha Múltipla
Em jogos repetidos com estratégia grim trigger, se o lucro de cooperação é \(\Pi_{coop} = 8\) e o lucro de desvio é \(\Pi_{dev} = 16\) (com punição Bertrand \(\Pi_N = 0\)), o factor de desconto mínimo para sustentar a colusão é:
- \(\delta \geq \dfrac{1}{4}\)
- \(\delta \geq \dfrac{1}{3}\)
- \(\delta \geq \dfrac{1}{2}\)
- \(\delta \geq \dfrac{2}{3}\)
4.4 Solução — Exercício 2
Condição: \(\dfrac{\Pi_{coop}}{1-\delta} \geq \Pi_{dev}\)
\[\frac{8}{1-\delta} \geq 16 \quad\Rightarrow\quad 8 \geq 16(1-\delta) \quad\Rightarrow\quad \delta \geq 1 - \frac{8}{16} = \frac{1}{2}\]
Resposta: (c)
Verificação: \(\delta = \frac{1}{2}\) \(\Rightarrow\) \(NPV_{\text{coop}} = \frac{8}{1/2} = 16 = NPV_{dev}\) ✓ (restrição vinculativa)
4.5 Exercício de Desenvolvimento
Duas empresas farmacêuticas produzem um medicamento genérico (produto homogéneo) e competem em preço. Em cada período, o lucro de monopólio partilhado é \(\Pi_{coop} = 60\) (cada), o lucro de desvio (capturar todo o mercado) é \(\Pi_{dev} = 100\), e o lucro de Nash de Bertrand é \(\Pi_N = 0\).
Alíneas:
- Explique por que razão, num jogo de uma só vez, nenhuma empresa consegue manter o preço de monopólio. Qual é o Equilíbrio de Nash estático?
- No jogo repetido com grim trigger, escreva as expressões para \(NPV_{\text{coop}}\) e \(NPV_{dev}\).
- Derive o valor mínimo de \(\delta\) para que a colusão seja sustentável.
- Interprete o resultado: que condições de mercado favorecem \(\delta\) acima do limiar calculado?
- Suponha que o regulador consegue aumentar a probabilidade de detecção do cartel, o que equivale a reduzir \(\Pi_{dev}\) para \(80\) (coima esperada reduz o ganho do desvio). Recalcule o \(\delta\) mínimo. O que conclui?
4.6 Solução — Exercício de Desenvolvimento
a) Num jogo de uma só vez, desviar domina: se a rival coopera, \(\Pi_{dev}=100 > \Pi_{coop}=60\); se a rival desvia, \(0 = 0\). Ambas desviam. EN estático: (Desviar, Desviar) = (0, 0). A colusão colapsa pela lógica do dilema do prisioneiro.
. . .
b) \[NPV_{\text{coop}} = \frac{60}{1-\delta} \qquad NPV_{dev} = 100 + \frac{\delta \cdot 0}{1-\delta} = 100\]
. . .
c) \(NPV_{\text{coop}} \geq NPV_{dev}\):
\[\frac{60}{1-\delta} \geq 100 \;\Rightarrow\; 60 \geq 100(1-\delta) \;\Rightarrow\; 100\delta \geq 40 \;\Rightarrow\; \boxed{\delta \geq \frac{2}{5}}\]
Verificação: \(\delta = \frac{2}{5}\) \(\Rightarrow\) \(NPV_{\text{coop}} = \frac{60}{3/5} = 100 = NPV_{dev}\) ✓ (restrição vinculativa)
. . .
d) \(\delta \geq \frac{2}{5}\) é mais fácil de satisfazer com taxas de juro baixas (empresas pacientes), horizonte longo, interacções frequentes e poucos concorrentes (monitorização fácil de desvios).
. . .
e) Com \(\Pi_{dev} = 80\):
\[\frac{60}{1-\delta} \geq 80 \;\Rightarrow\; 60 \geq 80(1-\delta) \;\Rightarrow\; 80\delta \geq 20 \;\Rightarrow\; \delta \geq \frac{1}{4}\]
Verificação: \(\delta = \frac{1}{4}\) \(\Rightarrow\) \(NPV_{\text{coop}} = \frac{60}{3/4} = 80 = NPV_{dev}\) ✓
O \(\delta\) mínimo baixou de \(\frac{2}{5}\) para \(\frac{1}{4}\): desviar tornou-se menos atractivo (o ganho cai de 100 para 80), pelo que empresas com menos paciência conseguem agora manter o acordo. A política de leniência funciona de forma diferente: ao reduzir o ganho do desvio, o regulador na verdade facilita a colusão tácita. O verdadeiro efeito dissuasor vem de reduzir os lucros de cooperação (proibição e coimas sobre os lucros do cartel), não apenas o ganho de desviar.