terça-feira, novembro 04, 2008

Exit polls

(Corrigido)
No FiveThirtyEight, 10 razões para ignorar as sondagens à boca das urnas: diz-se o que eu tinha dito aqui, e muito mais.

Pergunta-se num comentário:
"A minha percepção é que as sondagens à boca da urna em Portugal tem sido mais precisas que as sondagens pré-eleitorais, embora todos nos lembremos de um ou dois casos em que falharam, como na segunda eleição de Guterres em que pelo menos uma delas previa a maioria absoluta. Há evidência que favoreçam a fiabilidade de um tipo de sondagens sobre as outras? A falta de credibilidade atribuída por este e outros blogues de sondagens (como o pollster) terá a ver com diferenças metodológicas?"

Algumas respostas em cima do joelho:
1. A percepção é correcta. Em abstracto, não pode deixar de ser assim. Uma sondagem à boca das urnas usa uma amostra muito maior que uma sondagem pré-eleitoral e mede comportamentos de votantes, não intenções de eventuais votantes.
2. O problema dos Estados Unidos começa por ser, claro, de exigência e escala. O que se pede como elemento informativo é uma boa estimativa do voto em cada um dos 50 estados (ou, no mínimo, dos 15 ou 16 estados mais competitivos), e não uma boa estimativa do voto popular no conjunto do país, ao contrário do que sucede em Portugal. Ainda por cima, quer-se sempre saber se há alguém que tenha mais um voto que qualquer um dos adversários em cada estado, e não se, digamos, o PS tem mais ou menos à volta de 43%. É muito difícil, e os recursos envolvidos são tão astronómicos que, nos EUA, há uma única sondagem à boca das urnas (e não três, como em Portugal).
3. Depois, há toda uma série de "trapalhadas" que nós podemos pura e simplesmente ignorar: early voting, antes de mais, assim como durações diferentes de abertura de locais de voto, regras diferentes de estado para estado, centenas de eleições diferentes a ocorrerem ao mesmo tempo (não se esqueçam que, em cada condado, se está a votar para muitas outras coisas para além do Presidente e diferentes umas das outras), etc, etc, etc.
4. Depois, o problema de recusa sistemática (ou de participação entusiástica) de um determinado tipo de eleitor ou outro, sendo também real em Portugal, parece ser, pelo que consigo perceber, muito menos grave (por enquanto).

Estou menos convencido com o ponto 1 dos argumentos de Nate Silver, ligado à amostragem. Claro que cluster sampling (onde só os indivíduos nos locais de voto seleccionados têm probabilidade de serem seleccionados) tem uma margem de erro maior que uma sondagem puramente aleatória (onde todos os eleitores têm a mesma probabilidade de serem seleccionados). Em rigor é mesmo assim e é por isso que os intervalos que cá se dão nas estimativas no fecho das urnas são maiores do que aquilo que seriam se as amostras fossem puramente aleatórias. Mas na prática, que sondagem acaba por ter uma amostra verdadeiramente aleatória? Nenhuma.

4 comentários:

Luis Ruano disse...

Reflectindo sobre o ponto um dos argumentos de Nate Silver, sobre cluster sampling - Em Portugal os locais de voto são atribuídos pelo numero de eleitor, o que pode tornar mais aleatória a amostra de eleitores colhida em cada local (pelo menos em termo de estrato social e orientação politica, talvez o mesmo não se verifique para a faixa etária). Não sei como se organizam as mesas de voto nos Estados Unidos, provavelmente de forma bastante heterogénea, estado a estado, mas tenho a ideia que têm em conta sobretudo o local de residência dos eleitores. Poderá isto tornar os grupos eleitorais de alguns locais de voto relativamente homogéneos, quando comparados com Portugal?

Anónimo disse...

Olá, não queres apostar o resto do teu dedo mindinho? Com um pouco de sorte ganhas a aposta e recuperas a ponta do dedo de volta.

Unknown disse...

Luís: com os actuais odds, ou recebo uma pontinha de uma unha (se apostar Obama e ganhar) ou um braço inteiro novo (se apostar McCain e ganhar). Seja como for, não me convém :-)

Unknown disse...

Luís (Ruano): é de facto muito provável que os locais de voto nos Estados Unidos, nos centros urbanos, sejam muito mais homogéneos do ponto de vista social e político que os nossos. Isso significa que captar a variância real da população dá mais trabalho e que com poucas unidades primárias de amostragem se correm riscos maiores. Estou de acordo consigo.