Aula 25 — Bertrand, Colusão e Jogos Repetidos
Em Cournot, duas empresas com \(Cmg = 6\) e procura \(P = 30 - Q\) obtêm:
\[Q_C = 16,\quad P_C = 14,\quad \Pi_C = 64 \text{ cada}\]
E se, em vez de escolherem quantidades, as empresas escolhessem preços?
Important
Esta é a diferença essencial entre Cournot e Bertrand: a variável estratégica. Mesma estrutura de mercado, mesmo número de empresas — resultado radicalmente diferente.
Com produto homogéneo, consumidores compram sempre à empresa mais barata.
Suponha que a Empresa B cobra \(P_B = 14\) (preço de Cournot):
Este processo — undercutting — só pára quando nenhuma empresa tem incentivo a baixar mais o preço.
\[P_A = P_B = Cmg = 6\]
Abaixo de \(Cmg\), vender implica prejuízo. Acima de \(Cmg\), a rival subcorta.
Important
Paradoxo de Bertrand: com apenas duas empresas, produto homogéneo e decisões simultâneas de preço, o equilíbrio de Nash é \(P = Cmg\) — o mesmo resultado que concorrência perfeita com infinitas empresas.
Verificação do Equilíbrio de Nash:
\[P^*_{\text{Bert}} = Cmg = 6 \qquad Q^*_{\text{Bert}} = 24 \qquad \Pi^*_{\text{Bert}} = 0\]
| Cournot | Bertrand | |
|---|---|---|
| Variável estratégica | Quantidade | Preço |
| Timing | Simultâneo | Simultâneo |
| Resultado | \(P > Cmg\), \(\Pi > 0\) | \(P = Cmg\), \(\Pi = 0\) |
| Equivalente a | — | Conc. Perfeita |
Note
O paradoxo levanta uma questão: qual o modelo mais realista? Depende do mercado. Quando as empresas constroem capacidade com antecedência (e depois competem em preço), o resultado aproxima-se de Cournot. Quando podem ajustar a oferta instantaneamente, Bertrand é mais adequado.
Na prática, o resultado de Bertrand raramente se verifica porque:
Tip
Este último ponto — a interacção repetida — é o tema da segunda parte desta aula. A repetição transforma o jogo e pode sustentar resultados que não seriam possíveis num jogo de uma só vez.
Se as empresas pudessem coordenar os preços, agiriam como um monopolista:
\[Q_m = 12,\quad P_m = 18,\quad \Pi_m = 144 \quad\Rightarrow\quad \Pi_{\text{cada}} = 72\]
Comparando com Bertrand (\(\Pi = 0\)) e Cournot (\(\Pi = 64\)), a colusão maximiza o lucro conjunto.
Mas cada empresa tem incentivo a desviar:
Se B mantém o preço de cartel \(P_B = 18\), A pode cobrar \(P_A = 17{,}99\) e capturar todo o mercado, obtendo \(\Pi_A \approx 144\) em vez de \(72\).
Important
Estrutura de Dilema do Prisioneiro (já conhecida da Aula 22): o resultado colectivamente óptimo (cooperar) não é sustentável num jogo de uma só vez porque cada empresa tem incentivo a desviar unilateralmente.
| B: Colusão (\(P_m\)) | B: Desviar (\(P_m - \varepsilon\)) | |
|---|---|---|
| A: Colusão | \((72,\ 72)\) | \((0,\ 144)\) |
| A: Desviar | \((144,\ 0)\) | \((0,\ 0)\) |
Desviar domina Colusão (num jogo de uma só vez): \(144 > 72\) se o outro coopera; \(0 = 0\) se o outro desvia.
EN: (Desviar, Desviar) = (0, 0) — mesma estrutura do dilema do prisioneiro. ✓
Num mercado real, as empresas interagem repetidamente — todos os meses, todos os anos.
A repetição introduz um elemento novo: a ameaça de represália futura.
Note
O jogo repetido não elimina o incentivo a desviar num único período — mas cria um trade-off inter-temporal: ganho imediato de desviar vs. perda de lucros futuros pela punição.
\(\delta \in (0,1)\) é o factor de desconto — mede quanto a empresa valoriza \(1\) euro de lucro no próximo período em comparação com \(1\) euro hoje.
O valor presente de um fluxo constante \(\Pi\) por período, para sempre:
\[NPV = \Pi + \delta\Pi + \delta^2\Pi + \ldots = \frac{\Pi}{1-\delta}\]
Tip
\(\delta\) pode interpretar-se como \(\dfrac{1}{1+r}\) onde \(r\) é a taxa de juro, ou como a probabilidade de o jogo continuar no próximo período.
A estratégia mais simples que pode sustentar a colusão:
Note
Grim Trigger (gatilho implacável):
Esta estratégia é simples e credível: uma vez activada a punição, jogar Bertrand é óptimo para ambas as empresas (é o EN do jogo estático). A ameaça é credível porque não requer que ninguém “sacrifique” lucros para punir.
Empresa A compara dois cenários:
Cooperar sempre (recebe \(\Pi_{coop}\) por período):
\[NPV_{\text{coop}} = \frac{\Pi_{coop}}{1-\delta}\]
Desviar hoje (recebe \(\Pi_{dev}\) hoje, depois punição \(\Pi_N = 0\) para sempre):
\[NPV_{dev} = \Pi_{dev} + \frac{\delta \cdot 0}{1-\delta} = \Pi_{dev}\]
Colusão sustentável se \(NPV_{\text{coop}} \geq NPV_{dev}\):
\[\frac{\Pi_{coop}}{1-\delta} \geq \Pi_{dev} \quad\Leftrightarrow\quad \delta \geq 1 - \frac{\Pi_{coop}}{\Pi_{dev}}\]
Com \(\Pi_{coop} = 72\) e \(\Pi_{dev} = 144\):
\[\frac{72}{1-\delta} \geq 144\]
\[72 \geq 144(1-\delta)\]
\[144\delta \geq 144 - 72 = 72\]
\[\boxed{\delta \geq \frac{1}{2}}\]
Important
Se \(\delta \geq \tfrac{1}{2}\), a colusão é sustentável com grim trigger. Se \(\delta < \tfrac{1}{2}\), a empresa prefere desviar hoje — o futuro não pesa suficientemente para disciplinar o comportamento presente.
Quanto maior \(\delta\) (mais paciente a empresa), maior \(NPV_{\text{coop}}\) — o fluxo futuro de lucros de colusão vale mais. Para \(\delta = \tfrac{1}{2}\): \(NPV_{\text{coop}} = \tfrac{72}{1/2} = 144 = NPV_{dev}\) — a empresa é indiferente.
A condição \(\delta \geq \tfrac{1}{2}\) é mais fácil de satisfazer quando:
Note
Implicação para a política de concorrência: os reguladores monitorizam especialmente mercados concentrados, estáveis e com interacções frequentes — precisamente onde a colusão tácita é mais fácil de sustentar.
| Estrutura | \(Q\) | \(P\) | \(\Pi\) cada | Eficiência |
|---|---|---|---|---|
| Monopólio/Cartel | \(12\) | \(18\) | \(72\) | Mínima |
| Stackelberg | \(18\) | \(12\) | \(72\ /\ 36\) | — |
| Cournot | \(16\) | \(14\) | \(64\) | Intermédia |
| Bertrand | \(24\) | \(6\) | \(0\) | Máxima |
| Conc. Perfeita | \(24\) | \(6\) | \(0\) | Máxima |
Important
Bertrand com produto homogéneo e custos idênticos reproduz exactamente o resultado de concorrência perfeita — com apenas duas empresas. A variável estratégica importa tanto quanto o número de concorrentes.
Duas empresas com produto homogéneo e \(Cmg = 10\) competem em preços (Bertrand). O equilíbrio de Nash é:
A lógica de undercutting: qualquer \(P > Cmg = 10\) é instável — a rival tem incentivo a cobrar \(P - \varepsilon\) e capturar todo o mercado.
O processo pára em \(P = Cmg = 10\): abaixo, há prejuízo; acima, a rival subcorta.
Resposta: (a)
Verificação Nash: se \(P_B = 10\), cobrar \(P_A < 10\) gera prejuízo; cobrar \(P_A > 10\) perde clientes; cobrar \(P_A = 10\) dá \(\Pi = 0\). Nenhum desvio é estritamente rentável. ✓
Em jogos repetidos com estratégia grim trigger, se o lucro de cooperação é \(\Pi_{coop} = 8\) e o lucro de desvio é \(\Pi_{dev} = 16\) (com punição Bertrand \(\Pi_N = 0\)), o factor de desconto mínimo para sustentar a colusão é:
Condição: \(\dfrac{\Pi_{coop}}{1-\delta} \geq \Pi_{dev}\)
\[\frac{8}{1-\delta} \geq 16 \quad\Rightarrow\quad 8 \geq 16(1-\delta) \quad\Rightarrow\quad \delta \geq 1 - \frac{8}{16} = \frac{1}{2}\]
Resposta: (c)
Verificação: \(\delta = \frac{1}{2}\) \(\Rightarrow\) \(NPV_{\text{coop}} = \frac{8}{1/2} = 16 = NPV_{dev}\) ✓ (restrição vinculativa)
Duas empresas farmacêuticas produzem um medicamento genérico (produto homogéneo) e competem em preço. Em cada período, o lucro de monopólio partilhado é \(\Pi_{coop} = 60\) (cada), o lucro de desvio (capturar todo o mercado) é \(\Pi_{dev} = 100\), e o lucro de Nash de Bertrand é \(\Pi_N = 0\).
Alíneas:
a) Num jogo de uma só vez, desviar domina: se a rival coopera, \(\Pi_{dev}=100 > \Pi_{coop}=60\); se a rival desvia, \(0 = 0\). Ambas desviam. EN estático: (Desviar, Desviar) = (0, 0). A colusão colapsa pela lógica do dilema do prisioneiro.
b) \[NPV_{\text{coop}} = \frac{60}{1-\delta} \qquad NPV_{dev} = 100 + \frac{\delta \cdot 0}{1-\delta} = 100\]
c) \(NPV_{\text{coop}} \geq NPV_{dev}\):
\[\frac{60}{1-\delta} \geq 100 \;\Rightarrow\; 60 \geq 100(1-\delta) \;\Rightarrow\; 100\delta \geq 40 \;\Rightarrow\; \boxed{\delta \geq \frac{2}{5}}\]
Verificação: \(\delta = \frac{2}{5}\) \(\Rightarrow\) \(NPV_{\text{coop}} = \frac{60}{3/5} = 100 = NPV_{dev}\) ✓ (restrição vinculativa)
d) \(\delta \geq \frac{2}{5}\) é mais fácil de satisfazer com taxas de juro baixas (empresas pacientes), horizonte longo, interacções frequentes e poucos concorrentes (monitorização fácil de desvios).
e) Com \(\Pi_{dev} = 80\):
\[\frac{60}{1-\delta} \geq 80 \;\Rightarrow\; 60 \geq 80(1-\delta) \;\Rightarrow\; 80\delta \geq 20 \;\Rightarrow\; \delta \geq \frac{1}{4}\]
Verificação: \(\delta = \frac{1}{4}\) \(\Rightarrow\) \(NPV_{\text{coop}} = \frac{60}{3/4} = 80 = NPV_{dev}\) ✓
O \(\delta\) mínimo baixou de \(\frac{2}{5}\) para \(\frac{1}{4}\): desviar tornou-se menos atractivo (o ganho cai de 100 para 80), pelo que empresas com menos paciência conseguem agora manter o acordo. A política de leniência funciona de forma diferente: ao reduzir o ganho do desvio, o regulador na verdade facilita a colusão tácita. O verdadeiro efeito dissuasor vem de reduzir os lucros de cooperação (proibição e coimas sobre os lucros do cartel), não apenas o ganho de desviar.
Microeconomia (Plano de Transição)