Microeconomia

Aula 25 — Bertrand, Colusão e Jogos Repetidos

ISCAL - IPL

O Modelo de Bertrand

Uma Pergunta Simples

Em Cournot, duas empresas com \(Cmg = 6\) e procura \(P = 30 - Q\) obtêm:

\[Q_C = 16,\quad P_C = 14,\quad \Pi_C = 64 \text{ cada}\]

E se, em vez de escolherem quantidades, as empresas escolhessem preços?

Important

Esta é a diferença essencial entre Cournot e Bertrand: a variável estratégica. Mesma estrutura de mercado, mesmo número de empresas — resultado radicalmente diferente.

A Lógica do Undercutting

Com produto homogéneo, consumidores compram sempre à empresa mais barata.

Suponha que a Empresa B cobra \(P_B = 14\) (preço de Cournot):

  • A Empresa A cobra \(P_A = 13{,}99\) — captura todo o mercado e ganha lucro positivo
  • B responde com \(P_B = 13{,}98\) — captura todo o mercado de volta
  • A responde com \(P_A = 13{,}97\ldots\)

Este processo — undercutting — só pára quando nenhuma empresa tem incentivo a baixar mais o preço.

\[P_A = P_B = Cmg = 6\]

Abaixo de \(Cmg\), vender implica prejuízo. Acima de \(Cmg\), a rival subcorta.

O Paradoxo de Bertrand

Important

Paradoxo de Bertrand: com apenas duas empresas, produto homogéneo e decisões simultâneas de preço, o equilíbrio de Nash é \(P = Cmg\) — o mesmo resultado que concorrência perfeita com infinitas empresas.

Verificação do Equilíbrio de Nash:

  • Se \(P_B = 6 = Cmg\): cobrar \(P_A < 6\) gera prejuízo; cobrar \(P_A > 6\) perde todos os clientes; cobrar \(P_A = 6\) dá lucro zero. Nenhum desvio é rentável.

\[P^*_{\text{Bert}} = Cmg = 6 \qquad Q^*_{\text{Bert}} = 24 \qquad \Pi^*_{\text{Bert}} = 0\]

Cournot vs. Bertrand — O que Muda?

Cournot Bertrand
Variável estratégica Quantidade Preço
Timing Simultâneo Simultâneo
Resultado \(P > Cmg\), \(\Pi > 0\) \(P = Cmg\), \(\Pi = 0\)
Equivalente a Conc. Perfeita

Note

O paradoxo levanta uma questão: qual o modelo mais realista? Depende do mercado. Quando as empresas constroem capacidade com antecedência (e depois competem em preço), o resultado aproxima-se de Cournot. Quando podem ajustar a oferta instantaneamente, Bertrand é mais adequado.

Saídas do Paradoxo

Na prática, o resultado de Bertrand raramente se verifica porque:

  • Diferenciação de produto — com produtos diferentes, a empresa que baixa o preço não captura imediatamente todo o mercado; há fidelização
  • Capacidade instalada limitada — se a empresa não tem capacidade para servir todo o mercado, o undercutting total não é possível
  • Interacção repetida — em mercados com encontros frequentes, a ameaça de represália pode sustentar preços acima de \(Cmg\)

Tip

Este último ponto — a interacção repetida — é o tema da segunda parte desta aula. A repetição transforma o jogo e pode sustentar resultados que não seriam possíveis num jogo de uma só vez.

Colusão e o Incentivo a Desviar

O Sonho do Cartel

Se as empresas pudessem coordenar os preços, agiriam como um monopolista:

\[Q_m = 12,\quad P_m = 18,\quad \Pi_m = 144 \quad\Rightarrow\quad \Pi_{\text{cada}} = 72\]

Comparando com Bertrand (\(\Pi = 0\)) e Cournot (\(\Pi = 64\)), a colusão maximiza o lucro conjunto.

Mas cada empresa tem incentivo a desviar:

Se B mantém o preço de cartel \(P_B = 18\), A pode cobrar \(P_A = 17{,}99\) e capturar todo o mercado, obtendo \(\Pi_A \approx 144\) em vez de \(72\).

Important

Estrutura de Dilema do Prisioneiro (já conhecida da Aula 22): o resultado colectivamente óptimo (cooperar) não é sustentável num jogo de uma só vez porque cada empresa tem incentivo a desviar unilateralmente.

Matriz do Jogo de Preços (Uma Vez)

B: Colusão (\(P_m\)) B: Desviar (\(P_m - \varepsilon\))
A: Colusão \((72,\ 72)\) \((0,\ 144)\)
A: Desviar \((144,\ 0)\) \((0,\ 0)\)

Desviar domina Colusão (num jogo de uma só vez): \(144 > 72\) se o outro coopera; \(0 = 0\) se o outro desvia.

EN: (Desviar, Desviar) = (0, 0) — mesma estrutura do dilema do prisioneiro. ✓

Jogos Repetidos e Colusão Sustentável

A Repetição Muda o Jogo

Num mercado real, as empresas interagem repetidamente — todos os meses, todos os anos.

A repetição introduz um elemento novo: a ameaça de represália futura.

  • Se A desviar hoje, B pune A amanhã (e depois, e sempre)
  • A punição reduz os lucros futuros de A
  • Se A valorizar suficientemente o futuro, a ameaça de punição pode impedir o desvio

Note

O jogo repetido não elimina o incentivo a desviar num único período — mas cria um trade-off inter-temporal: ganho imediato de desviar vs. perda de lucros futuros pela punição.

O Factor de Desconto \(\delta\)

\(\delta \in (0,1)\) é o factor de desconto — mede quanto a empresa valoriza \(1\) euro de lucro no próximo período em comparação com \(1\) euro hoje.

  • \(\delta\) próximo de \(1\): empresa muito paciente — valoriza muito o futuro
  • \(\delta\) próximo de \(0\): empresa impaciente — quase só valoriza o presente

O valor presente de um fluxo constante \(\Pi\) por período, para sempre:

\[NPV = \Pi + \delta\Pi + \delta^2\Pi + \ldots = \frac{\Pi}{1-\delta}\]

Tip

\(\delta\) pode interpretar-se como \(\dfrac{1}{1+r}\) onde \(r\) é a taxa de juro, ou como a probabilidade de o jogo continuar no próximo período.

Estratégia Grim Trigger

A estratégia mais simples que pode sustentar a colusão:

Note

Grim Trigger (gatilho implacável):

  • Cooperar (cobrar \(P_m\)) enquanto o rival cooperar
  • Se o rival desviar alguma vez: punir para sempre — cobrar \(P = Cmg\) (Bertrand) eternamente

Esta estratégia é simples e credível: uma vez activada a punição, jogar Bertrand é óptimo para ambas as empresas (é o EN do jogo estático). A ameaça é credível porque não requer que ninguém “sacrifique” lucros para punir.

Condição de Sustentabilidade da Colusão

Empresa A compara dois cenários:

Cooperar sempre (recebe \(\Pi_{coop}\) por período):

\[NPV_{\text{coop}} = \frac{\Pi_{coop}}{1-\delta}\]

Desviar hoje (recebe \(\Pi_{dev}\) hoje, depois punição \(\Pi_N = 0\) para sempre):

\[NPV_{dev} = \Pi_{dev} + \frac{\delta \cdot 0}{1-\delta} = \Pi_{dev}\]

Colusão sustentável se \(NPV_{\text{coop}} \geq NPV_{dev}\):

\[\frac{\Pi_{coop}}{1-\delta} \geq \Pi_{dev} \quad\Leftrightarrow\quad \delta \geq 1 - \frac{\Pi_{coop}}{\Pi_{dev}}\]

Derivação do \(\delta\) Mínimo

Com \(\Pi_{coop} = 72\) e \(\Pi_{dev} = 144\):

\[\frac{72}{1-\delta} \geq 144\]

\[72 \geq 144(1-\delta)\]

\[144\delta \geq 144 - 72 = 72\]

\[\boxed{\delta \geq \frac{1}{2}}\]

Important

Se \(\delta \geq \tfrac{1}{2}\), a colusão é sustentável com grim trigger. Se \(\delta < \tfrac{1}{2}\), a empresa prefere desviar hoje — o futuro não pesa suficientemente para disciplinar o comportamento presente.

Interpretação Económica de \(\delta \geq \frac{1}{2}\)

Quanto maior \(\delta\) (mais paciente a empresa), maior \(NPV_{\text{coop}}\) — o fluxo futuro de lucros de colusão vale mais. Para \(\delta = \tfrac{1}{2}\): \(NPV_{\text{coop}} = \tfrac{72}{1/2} = 144 = NPV_{dev}\) — a empresa é indiferente.

Quando é a Colusão Mais Provável?

A condição \(\delta \geq \tfrac{1}{2}\) é mais fácil de satisfazer quando:

  • Taxas de juro baixas\(\delta = 1/(1+r)\) é maior quando \(r\) é pequeno; o futuro desconta menos
  • Mercado estável e de longa duração — horizonte longo aumenta o valor dos lucros futuros
  • Interacções frequentes — empresas que se encontram frequentemente têm mais oportunidades de punir desvios rapidamente
  • Poucos participantes — é mais fácil monitorizar o comportamento das rivais e detectar desvios
  • Lucro de desvio relativamente pequeno — se \(\Pi_{dev}/\Pi_{coop}\) for baixo, o \(\delta\) necessário é menor

Note

Implicação para a política de concorrência: os reguladores monitorizam especialmente mercados concentrados, estáveis e com interacções frequentes — precisamente onde a colusão tácita é mais fácil de sustentar.

Tabela Final: Todas as Estruturas

Estrutura \(Q\) \(P\) \(\Pi\) cada Eficiência
Monopólio/Cartel \(12\) \(18\) \(72\) Mínima
Stackelberg \(18\) \(12\) \(72\ /\ 36\)
Cournot \(16\) \(14\) \(64\) Intermédia
Bertrand \(24\) \(6\) \(0\) Máxima
Conc. Perfeita \(24\) \(6\) \(0\) Máxima

Important

Bertrand com produto homogéneo e custos idênticos reproduz exactamente o resultado de concorrência perfeita — com apenas duas empresas. A variável estratégica importa tanto quanto o número de concorrentes.

Exercícios

Exercício 1 — Escolha Múltipla

Duas empresas com produto homogéneo e \(Cmg = 10\) competem em preços (Bertrand). O equilíbrio de Nash é:

  1. \(P = 10\), \(\Pi = 0\) para cada empresa
  2. \(P > 10\), com lucros positivos para ambas
  3. Uma empresa cobra \(P > 10\) e a outra cobra \(P = 10\)
  4. Depende da procura — não há solução geral

Solução — Exercício 1

A lógica de undercutting: qualquer \(P > Cmg = 10\) é instável — a rival tem incentivo a cobrar \(P - \varepsilon\) e capturar todo o mercado.

O processo pára em \(P = Cmg = 10\): abaixo, há prejuízo; acima, a rival subcorta.

Resposta: (a)

Verificação Nash: se \(P_B = 10\), cobrar \(P_A < 10\) gera prejuízo; cobrar \(P_A > 10\) perde clientes; cobrar \(P_A = 10\)\(\Pi = 0\). Nenhum desvio é estritamente rentável. ✓

Exercício 2 — Escolha Múltipla

Em jogos repetidos com estratégia grim trigger, se o lucro de cooperação é \(\Pi_{coop} = 8\) e o lucro de desvio é \(\Pi_{dev} = 16\) (com punição Bertrand \(\Pi_N = 0\)), o factor de desconto mínimo para sustentar a colusão é:

  1. \(\delta \geq \dfrac{1}{4}\)
  2. \(\delta \geq \dfrac{1}{3}\)
  3. \(\delta \geq \dfrac{1}{2}\)
  4. \(\delta \geq \dfrac{2}{3}\)

Solução — Exercício 2

Condição: \(\dfrac{\Pi_{coop}}{1-\delta} \geq \Pi_{dev}\)

\[\frac{8}{1-\delta} \geq 16 \quad\Rightarrow\quad 8 \geq 16(1-\delta) \quad\Rightarrow\quad \delta \geq 1 - \frac{8}{16} = \frac{1}{2}\]

Resposta: (c)

Verificação: \(\delta = \frac{1}{2}\) \(\Rightarrow\) \(NPV_{\text{coop}} = \frac{8}{1/2} = 16 = NPV_{dev}\) ✓ (restrição vinculativa)

Exercício de Desenvolvimento

Duas empresas farmacêuticas produzem um medicamento genérico (produto homogéneo) e competem em preço. Em cada período, o lucro de monopólio partilhado é \(\Pi_{coop} = 60\) (cada), o lucro de desvio (capturar todo o mercado) é \(\Pi_{dev} = 100\), e o lucro de Nash de Bertrand é \(\Pi_N = 0\).

Alíneas:

  1. Explique por que razão, num jogo de uma só vez, nenhuma empresa consegue manter o preço de monopólio. Qual é o Equilíbrio de Nash estático?
  2. No jogo repetido com grim trigger, escreva as expressões para \(NPV_{\text{coop}}\) e \(NPV_{dev}\).
  3. Derive o valor mínimo de \(\delta\) para que a colusão seja sustentável.
  4. Interprete o resultado: que condições de mercado favorecem \(\delta\) acima do limiar calculado?
  5. Suponha que o regulador consegue aumentar a probabilidade de detecção do cartel, o que equivale a reduzir \(\Pi_{dev}\) para \(80\) (coima esperada reduz o ganho do desvio). Recalcule o \(\delta\) mínimo. O que conclui?

Solução — Exercício de Desenvolvimento

a) Num jogo de uma só vez, desviar domina: se a rival coopera, \(\Pi_{dev}=100 > \Pi_{coop}=60\); se a rival desvia, \(0 = 0\). Ambas desviam. EN estático: (Desviar, Desviar) = (0, 0). A colusão colapsa pela lógica do dilema do prisioneiro.

b) \[NPV_{\text{coop}} = \frac{60}{1-\delta} \qquad NPV_{dev} = 100 + \frac{\delta \cdot 0}{1-\delta} = 100\]

c) \(NPV_{\text{coop}} \geq NPV_{dev}\):

\[\frac{60}{1-\delta} \geq 100 \;\Rightarrow\; 60 \geq 100(1-\delta) \;\Rightarrow\; 100\delta \geq 40 \;\Rightarrow\; \boxed{\delta \geq \frac{2}{5}}\]

Verificação: \(\delta = \frac{2}{5}\) \(\Rightarrow\) \(NPV_{\text{coop}} = \frac{60}{3/5} = 100 = NPV_{dev}\) ✓ (restrição vinculativa)

d) \(\delta \geq \frac{2}{5}\) é mais fácil de satisfazer com taxas de juro baixas (empresas pacientes), horizonte longo, interacções frequentes e poucos concorrentes (monitorização fácil de desvios).

Solução — Exercício de Desenvolvimento

e) Com \(\Pi_{dev} = 80\):

\[\frac{60}{1-\delta} \geq 80 \;\Rightarrow\; 60 \geq 80(1-\delta) \;\Rightarrow\; 80\delta \geq 20 \;\Rightarrow\; \delta \geq \frac{1}{4}\]

Verificação: \(\delta = \frac{1}{4}\) \(\Rightarrow\) \(NPV_{\text{coop}} = \frac{60}{3/4} = 80 = NPV_{dev}\)

O \(\delta\) mínimo baixou de \(\frac{2}{5}\) para \(\frac{1}{4}\): desviar tornou-se menos atractivo (o ganho cai de 100 para 80), pelo que empresas com menos paciência conseguem agora manter o acordo. A política de leniência funciona de forma diferente: ao reduzir o ganho do desvio, o regulador na verdade facilita a colusão tácita. O verdadeiro efeito dissuasor vem de reduzir os lucros de cooperação (proibição e coimas sobre os lucros do cartel), não apenas o ganho de desviar.