Microeconomia

Aula 25 — Bertrand, Colusão e Jogos Repetidos

Author

ISCAL - IPL

1 O Modelo de Bertrand

1.1 Uma Pergunta Simples

Em Cournot, duas empresas com \(Cmg = 6\) e procura \(P = 30 - Q\) obtêm:

\[Q_C = 16,\quad P_C = 14,\quad \Pi_C = 64 \text{ cada}\]

. . .

E se, em vez de escolherem quantidades, as empresas escolhessem preços?

. . .

Important

Esta é a diferença essencial entre Cournot e Bertrand: a variável estratégica. Mesma estrutura de mercado, mesmo número de empresas — resultado radicalmente diferente.

1.2 A Lógica do Undercutting

Com produto homogéneo, consumidores compram sempre à empresa mais barata.

. . .

Suponha que a Empresa B cobra \(P_B = 14\) (preço de Cournot):

A Empresa A cobra \(P_A = 13{,}99\) — captura todo o mercado e ganha lucro positivo
B responde com \(P_B = 13{,}98\) — captura todo o mercado de volta
A responde com \(P_A = 13{,}97\ldots\)

. . .

Este processo — undercutting — só pára quando nenhuma empresa tem incentivo a baixar mais o preço.

. . .

\[P_A = P_B = Cmg = 6\]

Abaixo de \(Cmg\), vender implica prejuízo. Acima de \(Cmg\), a rival subcorta.

1.3 O Paradoxo de Bertrand

Important

Paradoxo de Bertrand: com apenas duas empresas, produto homogéneo e decisões simultâneas de preço, o equilíbrio de Nash é \(P = Cmg\) — o mesmo resultado que concorrência perfeita com infinitas empresas.

. . .

Verificação do Equilíbrio de Nash:

Se \(P_B = 6 = Cmg\): cobrar \(P_A < 6\) gera prejuízo; cobrar \(P_A > 6\) perde todos os clientes; cobrar \(P_A = 6\) dá lucro zero. Nenhum desvio é rentável. ✓

. . .

\[P^*_{\text{Bert}} = Cmg = 6 \qquad Q^*_{\text{Bert}} = 24 \qquad \Pi^*_{\text{Bert}} = 0\]

1.4 Cournot vs. Bertrand — O que Muda?

	Cournot	Bertrand
Variável estratégica	Quantidade	Preço
Timing	Simultâneo	Simultâneo
Resultado	\(P > Cmg\), \(\Pi > 0\)	\(P = Cmg\), \(\Pi = 0\)
Equivalente a	—	Conc. Perfeita

. . .

Note

O paradoxo levanta uma questão: qual o modelo mais realista? Depende do mercado. Quando as empresas constroem capacidade com antecedência (e depois competem em preço), o resultado aproxima-se de Cournot. Quando podem ajustar a oferta instantaneamente, Bertrand é mais adequado.

1.5 Saídas do Paradoxo

Na prática, o resultado de Bertrand raramente se verifica porque:

Diferenciação de produto — com produtos diferentes, a empresa que baixa o preço não captura imediatamente todo o mercado; há fidelização
Capacidade instalada limitada — se a empresa não tem capacidade para servir todo o mercado, o undercutting total não é possível
Interacção repetida — em mercados com encontros frequentes, a ameaça de represália pode sustentar preços acima de \(Cmg\)

. . .

Tip

Este último ponto — a interacção repetida — é o tema da segunda parte desta aula. A repetição transforma o jogo e pode sustentar resultados que não seriam possíveis num jogo de uma só vez.

2 Colusão e o Incentivo a Desviar

2.1 O Sonho do Cartel

Se as empresas pudessem coordenar os preços, agiriam como um monopolista:

\[Q_m = 12,\quad P_m = 18,\quad \Pi_m = 144 \quad\Rightarrow\quad \Pi_{\text{cada}} = 72\]

. . .

Comparando com Bertrand (\(\Pi = 0\)) e Cournot (\(\Pi = 64\)), a colusão maximiza o lucro conjunto.

. . .

Mas cada empresa tem incentivo a desviar:

. . .

Se B mantém o preço de cartel \(P_B = 18\), A pode cobrar \(P_A = 17{,}99\) e capturar todo o mercado, obtendo \(\Pi_A \approx 144\) em vez de \(72\).

. . .

Important

Estrutura de Dilema do Prisioneiro (já conhecida da Aula 22): o resultado colectivamente óptimo (cooperar) não é sustentável num jogo de uma só vez porque cada empresa tem incentivo a desviar unilateralmente.

2.2 Matriz do Jogo de Preços (Uma Vez)

. . .

Desviar domina Colusão (num jogo de uma só vez): \(144 > 72\) se o outro coopera; \(0 = 0\) se o outro desvia.

EN: (Desviar, Desviar) = (0, 0) — mesma estrutura do dilema do prisioneiro. ✓

3 Jogos Repetidos e Colusão Sustentável

3.1 A Repetição Muda o Jogo

Num mercado real, as empresas interagem repetidamente — todos os meses, todos os anos.

. . .

A repetição introduz um elemento novo: a ameaça de represália futura.

. . .

Se A desviar hoje, B pune A amanhã (e depois, e sempre)
A punição reduz os lucros futuros de A
Se A valorizar suficientemente o futuro, a ameaça de punição pode impedir o desvio

. . .

Note

O jogo repetido não elimina o incentivo a desviar num único período — mas cria um trade-off inter-temporal: ganho imediato de desviar vs. perda de lucros futuros pela punição.

3.2 O Factor de Desconto \(\delta\)

\(\delta \in (0,1)\) é o factor de desconto — mede quanto a empresa valoriza \(1\) euro de lucro no próximo período em comparação com \(1\) euro hoje.

. . .

\(\delta\) próximo de \(1\): empresa muito paciente — valoriza muito o futuro
\(\delta\) próximo de \(0\): empresa impaciente — quase só valoriza o presente

. . .

O valor presente de um fluxo constante \(\Pi\) por período, para sempre:

\[NPV = \Pi + \delta\Pi + \delta^2\Pi + \ldots = \frac{\Pi}{1-\delta}\]

. . .

Tip

\(\delta\) pode interpretar-se como \(\dfrac{1}{1+r}\) onde \(r\) é a taxa de juro, ou como a probabilidade de o jogo continuar no próximo período.

3.3 Estratégia Grim Trigger

A estratégia mais simples que pode sustentar a colusão:

. . .

Note

Grim Trigger (gatilho implacável):

Cooperar (cobrar \(P_m\)) enquanto o rival cooperar
Se o rival desviar alguma vez: punir para sempre — cobrar \(P = Cmg\) (Bertrand) eternamente

. . .

Esta estratégia é simples e credível: uma vez activada a punição, jogar Bertrand é óptimo para ambas as empresas (é o EN do jogo estático). A ameaça é credível porque não requer que ninguém “sacrifique” lucros para punir.

3.4 Condição de Sustentabilidade da Colusão

Empresa A compara dois cenários:

. . .

Cooperar sempre (recebe \(\Pi_{coop}\) por período):

\[NPV_{\text{coop}} = \frac{\Pi_{coop}}{1-\delta}\]

. . .

Desviar hoje (recebe \(\Pi_{dev}\) hoje, depois punição \(\Pi_N = 0\) para sempre):

\[NPV_{dev} = \Pi_{dev} + \frac{\delta \cdot 0}{1-\delta} = \Pi_{dev}\]

. . .

Colusão sustentável se \(NPV_{\text{coop}} \geq NPV_{dev}\):

\[\frac{\Pi_{coop}}{1-\delta} \geq \Pi_{dev} \quad\Leftrightarrow\quad \delta \geq 1 - \frac{\Pi_{coop}}{\Pi_{dev}}\]

3.5 Derivação do \(\delta\) Mínimo

Com \(\Pi_{coop} = 72\) e \(\Pi_{dev} = 144\):

\[\frac{72}{1-\delta} \geq 144\]

. . .

\[72 \geq 144(1-\delta)\]

. . .

\[144\delta \geq 144 - 72 = 72\]

. . .

\[\boxed{\delta \geq \frac{1}{2}}\]

. . .

Important

Se \(\delta \geq \tfrac{1}{2}\), a colusão é sustentável com grim trigger. Se \(\delta < \tfrac{1}{2}\), a empresa prefere desviar hoje — o futuro não pesa suficientemente para disciplinar o comportamento presente.

3.6 Interpretação Económica de \(\delta \geq \frac{1}{2}\)

. . .

Quanto maior \(\delta\) (mais paciente a empresa), maior \(NPV_{\text{coop}}\) — o fluxo futuro de lucros de colusão vale mais. Para \(\delta = \tfrac{1}{2}\): \(NPV_{\text{coop}} = \tfrac{72}{1/2} = 144 = NPV_{dev}\) — a empresa é indiferente.

3.7 Quando é a Colusão Mais Provável?

A condição \(\delta \geq \tfrac{1}{2}\) é mais fácil de satisfazer quando:

Taxas de juro baixas — \(\delta = 1/(1+r)\) é maior quando \(r\) é pequeno; o futuro desconta menos
Mercado estável e de longa duração — horizon longo aumenta o valor dos lucros futuros
Interacções frequentes — empresas que se encontram frequentemente têm mais oportunidades de punir desvios rapidamente
Poucos participantes — é mais fácil monitorizar o comportamento das rivais e detectar desvios
Lucro de desvio relativamente pequeno — se \(\Pi_{dev}/\Pi_{coop}\) for baixo, o \(\delta\) necessário é menor

. . .

Note

Implicação para a política de concorrência: os reguladores monitorizam especialmente mercados concentrados, estáveis e com interacções frequentes — precisamente onde a colusão tácita é mais fácil de sustentar.

3.8 Tabela Final: Todas as Estruturas

Estrutura	\(Q\)	\(P\)	\(\Pi\) cada	Eficiência
Monopólio/Cartel	\(12\)	\(18\)	\(72\)	Mínima
Stackelberg	\(18\)	\(12\)	\(72\ /\ 36\)	—
Cournot	\(16\)	\(14\)	\(64\)	Intermédia
Bertrand	\(24\)	\(6\)	\(0\)	Máxima
Conc. Perfeita	\(24\)	\(6\)	\(0\)	Máxima

. . .

Important

Bertrand com produto homogéneo e custos idênticos reproduz exactamente o resultado de concorrência perfeita — com apenas duas empresas. A variável estratégica importa tanto quanto o número de concorrentes.

4 Exercícios

4.1 Exercício 1 — Escolha Múltipla

Duas empresas com produto homogéneo e \(Cmg = 10\) competem em preços (Bertrand). O equilíbrio de Nash é:

\(P = 10\), \(\Pi = 0\) para cada empresa
\(P > 10\), com lucros positivos para ambas
Uma empresa cobra \(P > 10\) e a outra cobra \(P = 10\)
Depende da procura — não há solução geral

4.2 Solução — Exercício 1

A lógica de undercutting: qualquer \(P > Cmg = 10\) é instável — a rival tem incentivo a cobrar \(P - \varepsilon\) e capturar todo o mercado.

O processo pára em \(P = Cmg = 10\): abaixo, há prejuízo; acima, a rival subcorta.

Resposta: (a)

Verificação Nash: se \(P_B = 10\), cobrar \(P_A < 10\) gera prejuízo; cobrar \(P_A > 10\) perde clientes; cobrar \(P_A = 10\) dá \(\Pi = 0\). Nenhum desvio é estritamente rentável. ✓

4.3 Exercício 2 — Escolha Múltipla

Em jogos repetidos com estratégia grim trigger, se o lucro de cooperação é \(\Pi_{coop} = 8\) e o lucro de desvio é \(\Pi_{dev} = 16\) (com punição Bertrand \(\Pi_N = 0\)), o factor de desconto mínimo para sustentar a colusão é:

\(\delta \geq \dfrac{1}{4}\)
\(\delta \geq \dfrac{1}{3}\)
\(\delta \geq \dfrac{1}{2}\)
\(\delta \geq \dfrac{2}{3}\)

4.4 Solução — Exercício 2

Condição: \(\dfrac{\Pi_{coop}}{1-\delta} \geq \Pi_{dev}\)

\[\frac{8}{1-\delta} \geq 16 \quad\Rightarrow\quad 8 \geq 16(1-\delta) \quad\Rightarrow\quad \delta \geq 1 - \frac{8}{16} = \frac{1}{2}\]

Resposta: (c)

Verificação: \(\delta = \frac{1}{2}\) \(\Rightarrow\) \(NPV_{\text{coop}} = \frac{8}{1/2} = 16 = NPV_{dev}\) ✓ (restrição vinculativa)

4.5 Exercício de Desenvolvimento

Duas empresas farmacêuticas produzem um medicamento genérico (produto homogéneo) e competem em preço. Em cada período, o lucro de monopólio partilhado é \(\Pi_{coop} = 60\) (cada), o lucro de desvio (capturar todo o mercado) é \(\Pi_{dev} = 100\), e o lucro de Nash de Bertrand é \(\Pi_N = 0\).

Alíneas:

Explique por que razão, num jogo de uma só vez, nenhuma empresa consegue manter o preço de monopólio. Qual é o Equilíbrio de Nash estático?
No jogo repetido com grim trigger, escreva as expressões para \(NPV_{\text{coop}}\) e \(NPV_{dev}\).
Derive o valor mínimo de \(\delta\) para que a colusão seja sustentável.
Interprete o resultado: que condições de mercado favorecem \(\delta\) acima do limiar calculado?
Suponha que o regulador consegue aumentar a probabilidade de detecção do cartel, o que equivale a reduzir \(\Pi_{dev}\) para \(80\) (coima esperada reduz o ganho do desvio). Recalcule o \(\delta\) mínimo. O que conclui?

4.6 Solução — Exercício de Desenvolvimento

a) Num jogo de uma só vez, desviar domina: se a rival coopera, \(\Pi_{dev}=100 > \Pi_{coop}=60\); se a rival desvia, \(0 = 0\). Ambas desviam. EN estático: (Desviar, Desviar) = (0, 0). A colusão colapsa pela lógica do dilema do prisioneiro.

. . .

b) \[NPV_{\text{coop}} = \frac{60}{1-\delta} \qquad NPV_{dev} = 100 + \frac{\delta \cdot 0}{1-\delta} = 100\]

. . .

c) \(NPV_{\text{coop}} \geq NPV_{dev}\):

\[\frac{60}{1-\delta} \geq 100 \;\Rightarrow\; 60 \geq 100(1-\delta) \;\Rightarrow\; 100\delta \geq 40 \;\Rightarrow\; \boxed{\delta \geq \frac{2}{5}}\]

Verificação: \(\delta = \frac{2}{5}\) \(\Rightarrow\) \(NPV_{\text{coop}} = \frac{60}{3/5} = 100 = NPV_{dev}\) ✓ (restrição vinculativa)

. . .

d) \(\delta \geq \frac{2}{5}\) é mais fácil de satisfazer com taxas de juro baixas (empresas pacientes), horizonte longo, interacções frequentes e poucos concorrentes (monitorização fácil de desvios).

. . .

e) Com \(\Pi_{dev} = 80\):

\[\frac{60}{1-\delta} \geq 80 \;\Rightarrow\; 60 \geq 80(1-\delta) \;\Rightarrow\; 80\delta \geq 20 \;\Rightarrow\; \delta \geq \frac{1}{4}\]

Verificação: \(\delta = \frac{1}{4}\) \(\Rightarrow\) \(NPV_{\text{coop}} = \frac{60}{3/4} = 80 = NPV_{dev}\) ✓

O \(\delta\) mínimo baixou de \(\frac{2}{5}\) para \(\frac{1}{4}\): desviar tornou-se menos atractivo (o ganho cai de 100 para 80), pelo que empresas com menos paciência conseguem agora manter o acordo. A política de leniência funciona de forma diferente: ao reduzir o ganho do desvio, o regulador na verdade facilita a colusão tácita. O verdadeiro efeito dissuasor vem de reduzir os lucros de cooperação (proibição e coimas sobre os lucros do cartel), não apenas o ganho de desviar.