Eu achei no mínimo estranho a diferença entre Lula e Alckmin ter aumentado tanto em apenas uma semana. Como bom matemático, fui ver a fundo a metodologia utilizada pelo Instituto. O Instituto Data-folha é considerado sério e adota metodologias próprias que eles consideram adequadas dentro da boa estatística. Porém, baseado nos resultados do primeiro turno, achei esquisitos os resultados desta última amostra. Baixei as tabelas detalhadas à disposição no site do Instituto. Vi algumas incongruências que demonstro a seguir:
1- Foram entrevistadas 7.133 pessoas em 25 estados. Ficaram de fora os estados do Amapá e Roraima. Até aí, tudo bem, pois o resultado nestes estados não afetaria o resultado geral de forma significativa.
Ao analisar a tabela geral de intenção vi os seguintes resultados absolutos:de 7.133 entrevistados, 3.964(55,6%) são Lula, 2.737(38,36%) são Alckmin, 242(3,38%) são branco/nulo/nenhum, 190(2,66%) é um número que não está demonstrado mas é o saldo para fechar os 7133 entrevistados. Nesta mesma tabela, existe uma linha chamada de resultado ponderado onde Lula passa para 57% e Alckmin para 38%, sendo 5% o saldo de brancos/nulos/nenhum que foi o resultado divulgado.Entendi que os 190 entrevistados “fantasmas” foram distribuídos no resultado geral. Comparando com os resultados do primeiro turno, infiro que grande parte dos votos de HH, Cristóvam e os nanicos foram para Lula, mais uma parcela dos brancos e nulos do primeiro turno e Alckmin não ganhou nem perdeu nada no caxangá, pois mantém os mesmos 38% do primeiro turno.
Mas o pior vem agora. O Data-Folha tem uma tabela de distribuição da amostragem por região do país. As entrevistas não foram feitas considerando a proporção correta de eleitores de cada região(a saber, Sudeste- 43,6%;Sul-15,1%;Nordeste-27,11%;Norte-COeste-14%). Entrevistaram mais eleitores no Sul(32,5%), menos no Nordeste(16,6%) e no Norte/Centro-Oeste(9,7%), e quase o mesmo número no Sudeste(43,2%). Aí, fizeram uma ponderação com base nesta distribuição, para corrigir a distorção da amostragem. Nesta ponderação, o resultado é extrapolado para a tabela principal, corrigindo os resultados absolutos. Me chamou a atenção também que o número de brancos/nulos/indecisos por região é consistentemente maior(12,5% em média) que o número final ponderado apresentado(5%). Não entendi a conta feita neste caso. Aqui estou inferindo que houve uma distribuição forçada da diferença média de 7,5% ou o que chamamos em matemática de “chutômetro”. Uma tentativa de distribuir a tendência dos indecisos baseada na ponderação final. Pela teoria dos erros, esse cálculo só faz aumentar a diferença a favor de quem já está na frente. Como a ponderação final é favorável a Lula, esta distribuição “forçada” só faz aumentar a diferença.
Na distribuição por região, Alckmin cai em todas elas se comparado ao primeiro turno. Parte dos votos dos outros candidatos migra para Lula e parte migra para o rol dos indecisos, brancos e nulos.Mas o resultado desta tabela não bate de novo com os 5% de indecisos brancos e nulos do resultado ponderado divulgado.Novamente um mistério.
Chego à seguinte conclusão: Apesar da seriedade do Instituto Data-Folha, houve um erro de amostragem. Foram entrevistadas pessoas em regiões e locais com características não adequadas à distribuição mais próxima do perfil real do eleitorado como deveria ser. Se foi proposital ou não não sei mas que é estranho, lá isso é. O problema é que se houve erro de amostragem, o resultado foi divulgado e já causou o efeito psicológico que devia causar.Desalento para que está atrás e incentivo para quem está na frente. Na próxima pesquisa, este resultado poderá se confirmar justamente pela psicologia, não pela matemática. E o Data-Folha se safará do erro cometido. Já vi este filme antes.