Pesquisas eleitorais: não atire no mensageiro!

Tudo estava indo bem, até aquele avião cair. De repente, com Marina Silva no páreo, as cartas se embaralharam. A vantagem da candidata socialista (lembrete: Marina agora está no Partido Socialista Brasileiro) só vai se alargando nas pesquisas de intenção de voto, deixando petistas e tucanos embasbacados, e levando o “intelectual” Emir Sader a esbravejar:

https://twitter.com/emirsader/status/505405584087474176

Boa pergunta, que o Terraço hoje tenta desvendar para seus leitores. Este post é dedicado a Emir Sader.

Se você pegar duas mil pessoas aleatoriamente no Brasil, elas terão uma opinião sobre quem deve ser presidente (ou “presidenta”) da república. Se você independentemente sortear novamente duas mil pessoas e fizer a mesma pergunta, obterá outras respostas. E poderá fazer isso tantas vezes quanto quiser, sem que consiga jamais chegar à exata mesma resposta. Prova cabal de que as pesquisas são furadas? Não.

De fato, por conta de uma propriedade maravilhosa da estatística, todas as vezes que nós fizermos a pesquisa com um grupo sorteado de eleitores, as respostas estarão quase sempre próximas umas das outras.

Digamos que o Datafolha tenha apurado que 35% dos eleitores desejem ver a presidente Dilma reeleita. Caso o instituto tivesse realizado paralelamente a mesma pesquisa, com um novo sorteio, com a mesma metodologia, podemos afirmar com muita segurança que o resultado estaria entre 33% e 37% pontos percentuais de intenções.

Esse padrão é conhecido como “distribuição normal de probabilidades”, e o fato de as inúmeras pesquisas realizadas com amostras aleatórias quase sempre mostrarem valores próximos uns dos outros se deve ao fato de que tudo no mundo está sujeito a essa lei da gravidade da estatística. É praticamente uma dádiva da natureza que nos permite fazer extrapolações com relação a amostras que, como bem observou Emir Sader, não chegam a perfazer nem um milésimo do universo de pessoas que se pretende analisar.

A tal distribuição normal não exclui a possibilidade de valores extremos – por exemplo, que o Datafolha apure equivocadamente um resultado de 80% de intenções de voto para Dilma – mas simplesmente confere remota probabilidade de que isso ocorra. Devido à forma conhecida da distribuição normal, os iniciados no assunto são capazes de escolher recortes probabilísticos que estabelecem os chamados “intervalos de confiança”, que são os “dois pontos para mais ou para menos” frequentemente mencionados na divulgação de pesquisas eleitorais.

[caption id="attachment_1701" align="aligncenter" width="588"]popo “Essa eleição tá tudo menos ‘normal'”[/caption]

Porém, embora facilite as coisas que as médias desses grupos de indivíduos selecionados sempre sigam a chamada “distribuição normal”, é um grande desafio selecionar um grupo de pessoas de forma realmente aleatória. Essa amostra do eleitorado (ou “mostra”, no linguajar moderno de Sader) visa ser “representativa” da população que se pretende estudar, e deverá conter o mínimo de viés possível.

Num eleitorado de 140 milhões de pessoas espalhados por um país de 8 milhões de quilômetros quadrados, não é tarefa trivial encontrar uma amostra aleatória representativa. Sobretudo porque no Brasil não se realizam pesquisas de intenção de voto por telefone, prática muito comum nos Estados Unidos e na qual a aleatorização é mais fácil. Os institutos de pesquisa brasileiros fazem recortes na população brasileira de acordo com dados demográficos da população e em geral estabelecem “cotas” para grupos específicos em regiões específicas, visando assim garantir uma amostra que seja ao mesmo tempo tão aleatória e representativa quanto possível. Diferenças de metodologia de seleção de amostras são os primeiros suspeitos para as discrepâncias entre as pesquisas dos diversos institutos.

Para tal, não basta entrevistar trinta pessoas, nem trezentas pessoas. Mas ao entrevistar 2.700 pessoas, o Datafolha já faz um trabalho de bom tamanho. De fato, quanto maior a amostra, mais certeza se pode ter dos resultados. Mas a precisão adicional da estimação vai caindo à medida que a amostra vai crescendo: às vezes o esforço de aumentar muito a amostra não compensa em termos de ganhos de qualidade da estimação. Em linhas gerais, se uma pesquisa resulta que 35% das 2.700 pessoas aleatoriamente selecionadas pretendem votar na Dilma, a distribuição normal nos garante que podemos fazer infinitas vezes a mesma pesquisa em 95% das pesquisas a proporção verdadeira de eleitores da Dilma estará dentro do intervalo entre 33% e 37%.

Além das suas dificuldades operacionais – que contemplam também a elaboração de um questionário que não induza respostas ao respondente –, as pesquisas de intenção de voto possuem um grave defeito: tiram um retrato estático de um processo dinâmico. As intenções de voto são tudo menos estáveis, e qualquer candidato quebra a cabeça para desvendar o que está na cabeça do eleitor e influenciar sua opinião.

Em geral, as pesquisas nas proximidades das eleições tendem a acertar seus prognósticos, embora isso varie de localidade para localidade. Mas para tomar alguns exemplos importantes, reunimos na tabela a seguir resultados de pesquisas realizadas pouco antes dos segundos turnos de eleições municipais em São Paulo e eleições presidenciais.

Pesquisas

As pesquisas podem veicular uma informação volátil, mas se forem bem feitas, tendem a ser uma estimativa confiável da opinião da população sobre um determinado tema num dado momento. Agora, se a foto do seu candidato nas pesquisas eleitorais está cada vez menos dourada, a culpa dificilmente será do Datafolha. Mesmo que você não goste da notícia, “don’t shoot the messenger”.

Alípio Ferreira Cantisani 10170219_10203335365288648_276252663_o

[1] https://twitter.com/emirsader/status/505405584087474176 Aliás, chegou a repetir a dose mais recentemente : https://twitter.com/emirsader/status/512021651442397184

Errata: Em versão anterior, o quarto último parágrafo dizia que “Em linhas gerais, se uma pesquisa resulta que 35% das 2.700 pessoas aleatoriamente selecionadas pretendem votar na Dilma, a distribuição normal nos garante que podemos fazer infinitas vezes a mesma pesquisa e em 95% dos casos o resultado estaria entre 33% e 37%”. A correção para a versão atual foi sugerida por Fernando Barbosa, do site economiadependrive.wordpress.com Agradecemos a observação!

Alípio Ferreira

Formou-se em economia pela EESP-FGV, onde desenvolveu sua paixão por números primos e poesia alemã. Foi editor-chefe da revista Gazeta Vargas, associação cultural formada por alunos das escolas de Administração, Economia e Direito da FGV-SP. Escreveu um artigo sobre plebiscitos suíços no Valor Econômico e foi funcionário público. Almeja glória e poder para todo o sempre. Hoje é mestrando em economia na Universidade de Tilburg, nos Países Baixos. Escreveu para o Terraço Econômico entre 2014 e 2017.

3 Comentários

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Yogh - Especialistas em WordPress