Copa do Mundo: estatísticas, projeções e estudos interessantes

Ano de copa do mundo é sempre muito parecido para o torcedor. Inicia-se com uma verdadeira cruzada pelas figurinhas mais raras, normalmente as brilhantes. Tão logo o álbum se completa, a atenção se volta para os bolões: tem da família, da firma e dos amigos e dos mais variados tipos, com apostas que raramente fogem de Brasil ou Alemanha.

Já perto do início do Mundial, antes da compra das vuvuzelas, é hora de receber relatórios de departamento econômico de bancos, prevendo, não o PIB, mas sim, vejamos, o campeão da Copa.

Se para muitos é um espanto, para nós economistas tudo está dentro da mais profunda normalidade. Muitos não sabem, mas economistas adoram aplicar suas técnicas em diferentes campos, o que inclui até mesmo o futebol.

Tem estudo para todo gosto. Por exemplo, jogar com o apoio da torcida faz diferença? Segundo um trabalho de 2016, os times tem uma vantagem significativa quando jogam diante de seus torcedores. E não é só porque conhecem melhor o campo ou porque estão menos cansados por não terem viajado: os autores conseguem isolar estatisticamente o efeito do incentivo da torcida. Além disso, o mesmo trabalho indica que o esse incentivo tende a viesar a decisão dos juízes em favor do time da casa[1].

E a mudança, em 1994, no sistema de pontuação (dando 3 pontos ao invés de 2 para o vencedor): tornou o jogo mais ofensivo? Dois economistas estudaram essa questão em 2006, com base em resultados de torneios espanhóis, e concluíram que não. Se por um lado a mudança estimulava mais os times ao ataque, por outro lado, estimulava também uma postura mais defensiva de quem estivesse à frente no placar, com esses efeitos se anulando[2].

Até as disputas de pênaltis são objeto de estudo dos economistas. E nesse caso a dica é sempre escolher fazer a primeira cobrança, pelo menos segundo estudo publicado em 2010, na mais prestigiosa revista acadêmica de economia, a AER. Os pesquisadores analisaram quase 1.500 cobranças em 129 disputas em várias décadas, mostrando que os efeitos psicológicos relacionados a ordem de cobrança favorecem as equipes que iniciam a disputa[3].

Questões demográficas também entram no radar. Bruno Rocha e Ricardo Politi, economistas brasileiros, estudaram o perfil dos jogadores do campeonato brasileiro e chegaram a conclusões interessantes. Por exemplo, indivíduos que nascem no 4º trimestre tem bem menos chances de se tornar profissional: na distribuição de nascimento dos jogadores, o último trimestre do ano tem a menor fatia em todas as posições, principalmente as que envolvem mais força física (zagueiros, volantes). Já na distribuição das etnias, a posição de goleiro foge completamente do padrão das demais, pois tem uma participação muito maior de brancos em relação às demais.

Interessado em saber quanto custa completar o Álbum da Copa? Veja nosso outro texto “Economia do Álbum da Copa 2018 – Quanto custa completar?”

Agora, você já pensou se existe alguma forma de antecipar o resultado de uma partida de futebol entre duas equipes? Não é uma tarefa fácil, mas três pesquisadores de física da Alemanha[4] usaram dados da Bundesliga de 20 temporadas (entre 1987-88 e 2007-08) para desenvolver uma forma de antecipar o resultado de uma partida.

Eles investigaram se a distribuição de gols segue uma natureza da Poisson. Quem for letrado em estatística já entendeu o que isso significa, mas explicando de forma simples: a Poisson expressa a probabilidade de um evento ocorrer num certo intervalo de tempo de determinada duração. Faz todo sentido pensar na probabilidade de gols durante uma partida, não?

Na verdade, os gols não seguem uma distribuição de Poisson, e sim um processo de Poisson. Mas o que raios é isso? É uma sutil diferença entre descrever a distribuição dos gols em uma partida e a distribuição dos gols marcados em uma partida ao longo de uma temporada. Mas isso são tecnicalidades.

Com essa informação podemos fazer dois exercícios. O primeiro é verificar se a soma dos gols das partidas da Copa de 2014 seguem a tal distribuição. Para isso vamos pegar os gols de todos os jogos, exceto prorrogação e pênalti, e verificar sua distribuição, sua média e variância, e verificar uma Poisson com tais parâmetros.

Ao verificar que a variância e a média da soma dos gols dessas partidas é próximo de 2,6, fizemos uma comparação com a distribuição usando 2,6 como parâmetro.

[caption id="attachment_12234" align="aligncenter" width="1016"] Fonte: Fifa. Elaboração dos autores.[/caption]

De fato, o resultado fica bem próximo, mas não é perfeito. Ainda assim, ela passa no teste Teste qui-quadrado de Pearson de que os dados seriam de uma distribuição Poisson, considerando cada soma de gols uma categoria.

Vamos fazer outro exercício simples: comparar os desempenhos das Seleções Brasileiras de 1994 e 2002. Assumindo que os gols da partida seguem a Poisson, simulamos qual era mais eficiente, dado que a primeira era mais defensiva e a segunda mais ofensiva. Vamos considerar os resultados: em 1994, (2,0), (3,0), (1,1), (1,0), (3,2), (1,0), (0,0); em 2002, (2,1), (4,0), (5,2), (2,0), (2,1), (1,0), (2,0).

Se chamarmos de X os gols feitos e Y os gols sofridos, o processo de Poisson de 1994 para a X terá parâmetro $\frac{11}{7}$, e para 2002 de $\frac{18}{7}$. Já Y terá parâmetro $\frac{3}{7}$ para 1994 e $\frac{4}{7}$ para 2002, sinalizando o maior poder defensivo de 1994 e ofensivo de 2002.[5]

Agora se chamarmos de Z o saldo de gols da cada partida (ou seja X-Y), é esperado que o maior número de jogos com saldo positivo sugira uma Seleção mais eficiente. Como temos poucas observações (apenas 7 em cada Copa), simulamos 10 milhões de jogos com tais parâmetros para ver em qual das Seleções há uma frequência maior de vitórias (ou seja, um Z positivo).

1994:

[sourcecode language=”r”] set.seed(100) n<-10000000 x<-rpois(n,11/7) y<-rpois(n,3/7) z<-x-y sum(z>0)/n [1] 0.6594211 ##frequência de vitórias [/sourcecode]

2002:

[sourcecode language=”r”] x<-rpois(n,18/7) y<-rpois(n,4/7) z<-x-y sum(z>0)/n [1] 0.8048636 ##frequência de vitórias [/sourcecode]

Em outras palavras, esse exercício sugere que se tais Seleções exibissem tais performances de suas Copas em cerca de 10 milhões de jogos, a frequência de vitórias da Seleção de 2002 seria maior que de 1994. Ponto para Ronaldo e Rivado. Interessante, não?

Você pode ver outras curiosidades (e críticas) envolvendo a Poisson e futebol em:

Poisson Distribution: Predict the score in soccer betting;

Soccer goal probabilities: Poisson vs Actual Distribution;

How to calculate Poisson distribution for football betting

Projeções para a Copa do Mundo de 2018

Bem, certamente você já viu algumas estimativas para os resultados da Copa do Mundo de 2018, o que é muito usado para basear as pessoas em casa de apostas. Uma rápida busca na internet nos trouxe 5 casas que projetam maiores chances para o Brasil ser campeão, seguido pela Alemanha.

[caption id="attachment_12235" align="aligncenter" width="462"] Fonte: Respectivos sites. Elaboração dos autores.[/caption]

Mas esse são projeções apenas para o resultado final. O pessoal do Itaú BBA fez (como sempre) um estudo bastante interessante contendo projeções em cada fase da Copa. O estudo pode ser acessado aqui (Copa do Mundo FIFA Rússia 2018™: quem tem mais chances de ganhar?) e utiliza de variáveis proxy para a qualidade da equipe no momento da competição, a sua tradição e o apoio recebido pela torcida, sugerindo Brasil como campeão da Copa de 2018 em cima da Alemanha. Eles usaram o bom e velho modelo Probit.

Como destaca o próprio estudo, “A cada etapa as previsões se tornam mais incertas, dada a proximidade das probabilidades de cada país passar para a fase seguinte, mas a chance de vitória que encontramos em nossos cálculos é ligeiramente maior para o Brasil.”

[caption id="attachment_12241" align="alignnone" width="567"] Fonte: Itaú BBA[/caption]

Bom, com todos esses interessantes achados (e álbuns completos) é hora então de encerrar o artigo e aproveitar o Mundial. Os relatórios já recebidos este ano são quase unânimes em apontar o Brasil como campeão. Por outro lado, dizem os mais céticos que isso também ocorreu em 2014. Será que desta vez celebraremos o hexa?

 

Arthur Lula Mota, Editor do Terraço Econômico

Guilherme Tinoco, Mestre em Economia pela USP

 

[1] “Does the Home Advantage Depend on Crowd Support? Evidence From Same-Stadium Derbies”, Ponzo e Vicenza (2016)

[2] “Sabotage in Tournaments: Making the Beautiful Game a Bit Less Beautiful”, Garicano e Palacios-Huerta (2006)

[3] “Psychological Pressure in Competitive Environments: Evidence from a Randomized Natural Experiment”. Apesteguia e Palacios-Huerta (2010). Este artigo já foi também repercutido por Mauro Rodrigues, do blog Economista X, em 2014.

[4] “Soccer: is scoring goals a predictable Poissonian process?”, Andreas Heuer, Christian Mueller, Oliver Rubner.

[5] Vale lembrar que a média é o estimador de máxima verossimilhança de tal distribuição.

Arthur Lula Mota

Mestre em Economia Aplicada pela Universidade de São Paulo (USP/ESALQ) e Bacharel em Economia pela Universidade Federal de São Paulo. Já trabalhou no mercado financeiro, auxiliando mesa de operações de fundos institucionais e departamento econômico com análises macroeconômicas.
Yogh - Especialistas em WordPress