A matemática de uma pesquisa de rua.

A Prática da pesquisa de rua é muito comum no Brasil, e é uma ferramenta de coleta de dados que agrupa informações através de perguntas direcionadas para um número n de pessoas, com o objetivo de obter um parâmetro de interesse P^ que pode ser intenção de voto, preferência por alguma empresa, universidade, time de futebol do coração, faixa de renda salarial , etc..

Esse parâmetro P^ é uma estimativa de proporção e possui um erro associado, visto que a pesquisa é feita para um número n de pessoas que não representa a população total, ou seja P^ é uma estimativa do verdadeiro parâmetro P o qual representa a real proporção. Note que quanto maior o n menor será o erro visto que n se aproximará mais do número real da população.

Um exemplo prático

Para que possamos entender melhor a ideia vejamos um exemplo:

Em uma pesquisa eleitoral de segundo turno  feita com 2000 pessoas, 1000 falaram que votarão no candidato A, 800 no candidato B e 200 não votarão em ninguém. Caso estejamos interessados em calcular a intenção de votos do candidato A, temos:

 P^ = 0,5, que representa 50% das intenções de votos na pesquisa, e n=2000.

Para calcular o erro associado à pesquisa e chegarmos a um intervalo que tenha uma chance muito grande de englobar o verdadeiro parâmetro P de intenções de voto precisamos estipular a confiança desse intervalo que é representada por  (1-α). Valores comuns para  α  vão de 0.01 a 0.1 significando um intervalo de confiança IC de (90 – 99%), note que não é possível ter um IC com 100% de confiança visto que n é diferente do número de pessoas da população. Geralmente usa-se um IC de 95% de confiança para pesquisas de rua.

Ex: Se o IC é de  95% de confiança, existe 95% de chance de 1 intervalo englobar o verdadeiro parâmetro P, segue uma figura com 100 destes intervalos de 95% de confiança.  

Note que na simulação de 100 intervalos, 94 englobam o real valor centrado em 0.5. Ou seja, 94%, que é um valor muito próximo do esperado de 95%.

O cálculo

O método de cálculo para estimar o real parâmetro P é chamado de método da quantidade pivotal.

Considere nesse caso que X representa P^ e que Zα/2 é um valor que depende de α e  contribui para o cálculo do erro. Basta consultar Zα/2 em uma tabela chamada de Tabela Z no nosso exemplo, usando um IC de 95%  consultaremos Z 0.025 , pois α= 0.05.

Calculando o exemplo prático

P^ = 0.5,  n = 2000, α=0.05 e  Z 0.025 = 1.96

 

Colocando os valores  na fórmula chegamos no resultado:

 

IC (p; 1-α) [ 0.5 -0.022 ; 0.5 + 0.022]

Interpretando o resultado:

Para esta pesquisa o erro é de 0.022 que corresponde 2,2 % de erro para mais ou para menos na intenção de votos ao candidato A.

Temos que 95% dos intervalos que vão de 47,8% à 52,2% englobam a verdadeira proporção de intenção de votos no candidato A.

 

Conclusão

Este método é bastante usado e traz uma boa estimativa para pesquisas de rua considerando sempre que as perguntas não são enviesadas ou seja que são amplas e bem distribuídas, não inclinando circunstâncias para uma resposta X ter relevância maior.

Referências

Graduando em Engenharia Elétrica | Membro do PET EEL desde 22.1

Interesses: Sistemas de energia e Consultoria

fariaseduardo403@gmail.com

LinkedIn

Eduardo Dellagnelo Farias
slotonline