Óbitos e votos: um estudo didático com os dados da COVID-19 no Brasil
Paulo Wenderson Teixeira Moraes
Prof. Adjunto UNEB
Psicologia
08 /06/2021
Capítulo 2
A média aritmética é um modelo tomado como referência para comparações em diversas áreas da sociedade. Longe de estar próxima de algum ideal, ela é um modelo conveniente em determinadas situações, mas impertinente em outas. Se uma criança tira uma nota 10, mas todos os seus colegas também tiram dez, ela tende a sonegar essa informação dos pais, pois isso parece indicar que sua nota está mais relacionada com a bondade do professor, que acariciou a todos com a nota máxima do que com o seu empenho propriamente dito. Entretanto, vamos combinar, eles não precisam ficar sabendo disso, tornando mais fácil a negociação de algum favorecimento no final de semana, como um presente ou um sorvete.
Numa situação adversa, porém, a média pode socorrer o aluno que não foi agraciado pela “sorte” de uma boa nota. Se ele tira uma nota quatro, pode se apoiar no fato de que a média da turma foi de três pontos e, portanto, ele ainda ficou acima da média. O péssimo desempenho, portanto, pode ter sido decorrente da severidade do professor que fez uma avaliação mais difícil do que o nível de preparação da turma. Aqui a média pode arrefecer o humor dos pais e amenizar um possível castigo por conta de baixo desempenho escolar.
Da mesma maneira que o filho manipula os pais, muitas vezes a média é omitia ou explicitamente declarada a depender da conveniência. No caso da contabilização de mortes, os Estados sempre buscam estar abaixo da média, pois isso é um indicativo de que há um cuidado com a saúde para evitar mortes desnecessária. Isso não significa que a média é um número ideal. Se todo o trabalho de prevenção, medidas sanitárias e vacinação fosse feito com perfeição e antecipadamente, o ideal seria zero mortes. Mas as autoridades demoraram um bom tempo para tomar providências e o vírus se espalhou de forma descontrolada, produzindo um estado de epidemia planetária, que mereceu o nome de pandemia. Tendo se espalhado e causado mortes, a tarefa que resta é verificar se a transmissão de deu de forma uniforme e igual para todos os lugares ou se houve diferenças na velocidade e intensidade da disseminação.
A média se torna uma ferramenta para examinar a regularidade dos casos diagnosticados por região. Estar acima ou abaixo pode ser uma informação crítica que leva a consequências semelhantes à recompensa ou a punição dos pais, guardadas as devidas proporções. Governos que obtiveram “nota baixa” na gestão da epidemia pode ser punido nas próximas eleições e deixar o poder. Um indicativo de nota baixa é o número de mortes que pode ter saído do controle. Como o filho esperto, alguns governantes tentam minimizar o efeito de uma “nota baixa”, justiçando os dados de contágio e morte como sendo reflexo de um fenômeno mais amplo e incontrolável, como se tirar nota boa fosse uma questão apenas de sorte e não de esforço e treinamento.
Para observar os “alunos-governantes” de forma mais acurada e comparar as suas performances na gestão dessa crise de saúde pública, o desvio é uma ferramenta interessante de organização das distâncias em relação à média. Na tabela 5, a seguir, é possível observar o número de mortes por Estado e seus respectivos desvios em relação à média. Em São Paulo, o número de mortes atribuídas ao coronavírus em 16 abril de 2020 foi de 87.326. Diminuindo a média de 13.657,37, chega-se ao número de 73.669, que significa o quanto esse Estado ficou acima da média. Quando o Estado tem menos mortes que a média, esse número fica negativo. Roraima, por exemplo, teve 4.737 mortes por COVID-19 nessa mesma data. Diminuindo da média, chega-se, na coluna da direita, denominada “Desvio”, ao valor de -8.920. Esse valor negativo significa que o Estado está 8.920 mortes abaixo da média.
Tabela 1: Porcentagem de votos em Jair Bolsonaro e óbitos por COVID-19 por Estado
* Percentual de votos dados a Jair Bolsonaro no 1º turno das eleições presidenciais de 2018, considerando a soma total dos votos. Fonte: TSE.
** Óbitos registrados até 16/04/2021, às 18:10h no site https://covid.saude.gov.br/
Olhando para o somatório total dos desvios se encontra o resultado zero. É um resultado esperado, pois se a média é um instrumento de definição de uma tendência central, os casos que ficaram acima da média tendem a anular os que ficaram abaixo dela. Por causa disso, é impossível calcular a média dos desvios, uma vez que zero dividido por qualquer número, dificilmente, sairá do zero. É preciso então fazer algum artifício no intuito de conseguir uma medida auxiliar para complementar o desvio bruto da média.
Antes disso, note que os desvios são uma medida relacionada à média específica com a qual se está trabalhando. Mudando a medida, aparentemente altera a visualização da escala com a qual se está trabalhando. Por exemplo, na tabela 6 a seguir, é possível fazer o mesmo procedimento com o percentual de votos no presidente em 2018. Os leitores mais atentos perceberam que anteriormente eu aproximei o percentual médio de votos para 0,42 (42%), reduzindo assim os dígitos para tornar o número mais elegante. Mas, para fazer o cálculo do desvio com precisão, a elegância pode gerar um resíduo de 0,07 quando realizado o somatório total dos desvios. Isso poderia atormentar aqueles mais atenciosos e dignos de São Tomé: além de precisar “ver para crer”, precisam calcular para ter certeza! Portanto, alcançar o “zerinho” redondo e perfeito demanda esforço: foi necessário utilizar um número mais preciso com quatro casas após a vírgula: 0,4174 (41,74%).
É possível observar que o maior desvio foi em Santa Cataria (SC), quase vinte pontos percentuais (0,1926) acima da média geral de votos no então candidato. Já o Rio Grande do Norte (RN) teve um desvio negativo de -0,1374. Aproximando ou arredondando a cifra, é possível dizer que esse Estado teve quase quatorze pontos percentuais abaixo da média geral de votos doados ao Presidente.
Dessa forma, o desvio por si só é uma medida muito específica do material com o qual se está trabalhando. A fim de ter algum parâmetro de comparação, os cientistas propuseram um procedimento que transforma os desvios numa medida mais geral, possibilitando uma visão mais acurada dos dados. Eles deram o nome de desvio padrão ao procedimento de elevar ao quadrado os desvios que vimos anteriormente, somar todos eles, tirar a raiz quadrada e dividir pelo número de casos ou indivíduos. Na tabela 7, a seguir, é possível visualizar como o processo é realizado. A artimanha de elevar ao quadrado faz com que os números negativos se tornem positivos e o resultado da soma deixa de ser zero. Isso faz com que se encontre uma medida de quanto os indivíduos de uma amostra se afastam da média, em média. Fazendo uma analogia com os conceitos de segunda ordem de Bateson(1999), pensar sobre o pensar ou aprender a aprender, aqui se trata da média das média.
Tabela 3: Porcentagem de votos em Jair Bolsonaro em ordem decrescente e mortalidade por COVID-19 por Estado
Tabela 4: número de óbitos em ordem decrescente e porcentagem de votos por Estado
* Percentual de votos dados a Jair Bolsonaro no 1º turno das eleições presidenciais de 2018, considerando a soma total dos votos. Fonte: TSE.
** Óbitos registrados até 16/04/2021, às 18:10h no site https://covid.saude.gov.br/
Tabela 7: Cálculo do desvio padrão do número de mortes por COVID-19 em 16 de abril de 2021.
Este livro é feito com o auxílio do leitor. A seguir, você pode deixar seus comentários. Se preferir entrar em contato diretamente com o autor, envie email para
Em breve, será submetido o capítulo 2 para o seu escrutínio ou deleite literário ou apenas para despassar o tempo com a desinventividade de João Cabral de Melo e Neto.
Os números começam a ficar estratosféricos, pois quando se eleva o desvio de São Paulo ao quadrado, por exemplo, se chega a uma cifra superior a 5 bilhões. Será que existe alguém que ainda faz esses cálculos no papel? Eu usei o Excel e confiei na máquina para ganhar mais tempo na escrita. Para os amantes de Sudoku, palavras cruzadas e exercícios de matemática aí está uma oportunidade de colocar o lápis para trabalhar: é só elevar todos os desvios da média ao quadrado que, em cerca de uma hora de zelosa labuta, chega-se aos valores da coluna da direita (desvio²). Mas o trabalho não para aí: tem que somar todos esses resultados e ultrapassar os sete bilhões, que podem ser conferidos na penúltima linha da tabela. Aí é só dividir esse número por 27, que é o número de elementos do grupo, no caso os Estados. Finalmente, chega-se à cifra “lotérica” da média dos desvios elevados ao quadrado, cerca de 290 milhões. Pensando num prêmio de loteria, essa média se torna até um número apreciável e todo o cálculo pode ganhar um sentido grandioso nos mais belos sonhos. Para que o sonho perdure, é preciso convencer a razão de que uma chance em mais de 53 milhões de possibilidades ainda é uma possibilidade, bastando acertar aqueles 6 números tão desejados. Se isso for muito dinheiro para apenas um indivíduo, podemos então tirar uma raiz quadrada dessa média e, como num sonho, chegamos ao desvio padrão: raiz quadrada de 290.068.970,53 é igual à 17.031,41. Se estiver algo errado nesse cálculo, por favor, enderece as reclamações para a Microsoft que é a proprietária do Excel e a responsável por programar as fórmulas que fazem o show instantâneo dos cálculos automáticos de números tão grandes. Todo esse processo é muito discreto e acontece em milésimos de segundos, na caixa preta dos processadores dos computadores. Aqueles que insistem em duvidar dos procedimentos matemáticos e científicos, podem nesse momento se entregar ao deleite de fazer os cálculos por si mesmo, voltando à Idade Média. Olha só, novamente a média, não tem como fugir dela...
Uma forma de usar o desvio padrão é construir uma escala na qual ele se torna uma espécie de medida. Colocando numa régua, o zero é o ponto da média, onde não há desvio. Aí é possível começar a contar em termos de desvios. Na figura 1, a seguir, é possível perceber onde cada Estado se posiciona nessa escala que pode ser chamada de régua do desvio padrão.
A régua mostra algumas anomalias nesse grupo de Estados que são pistas importantes para compreender esse conjunto de dados. Primeiramente, observa-se que ao descer menos um desvio padrão abaixo da média de 13.657 mortes, chega-se a um número negativo de -3.374. A operação é a seguinte: Média menos o desvio padrão, ou seja, 13657 - 17.031,41 = -3.374. Isso é um absurdo, pois ainda não foi relatado nenhum caso de pessoa que tenha ressuscitado depois do atestado de óbito por COVID-19 dada por algum médico. Assim, não tem nenhum Estado que tenha relatado esse prodígio. O que se pode afirmar, entretanto, é a existência de 20 Estados que ficaram com o número de óbitos entre a média e um desvio padrão abaixo da média. Passando da média, ficaram 5 Estados entre ela e um desvio padrão acima (Média mais um desvio padrão, ou seja, 13657 + 17.031,41 = 30.688). O Estado do Rio de Janeiro ficou quase exatamente há dois desvios padrões acima da média. E por fim, São Paulo ultrapassou os quatro desvios padrões acima da média, ficando o meio caminho entre o quarto e o quito andar, ou em palavras mais formais entre quatro e cinco desvios padrões acima da média. Essa distribuição de dados está alarmantemente anormal e algum fenômeno está explicando essa distorção. Há uma concentração no primeiro degrau da escala e um caso extremo no alto. Ao ler o capítulo 1, muitos leitores já haviam alertado para isso e mataram a charada. Mas será em outro capítulo que o mistério será revelado completamente, pois é necessário avançar didaticamente em alguns conceitos antes de caminhar nessa direção. Nem todos tem sua velocidade, caro e atencioso leitor, então vamos juntos (Come together).
O mesmo cálculo para o desvio pode ser feito para a porcentagem também. Assim poderemos comparar duas escalas diferente e como a régua do desvio padrão se comporta em uma outra situação, onde os números são muito pequenos e representam outra coisa. Na tabela 7, a seguir, é possível observar os mesmos fenômenos da tabela 6 anterior: o somatório dos desvios é igual a zero, elevando-se ao quadrado, os desvios negativos passam a ser positivos o que possibilita ter um somatório diferente de zero.
Diferente da régua aplicada aos óbitos, nos votos não houve percentagem negativa para representar a subtração do desvio padrão da média. Como os “comunas” gostariam que aqui se encontrassem casos de Estados posicionados em um patamar abaixo de zero e, portanto, negativo! Assim seria possível reverter esses votos do passado e mudar toda história num passe de mágica. Isso são meros delírios à esquerda. Os dados se apresentaram de forma mais harmônica em torno da média, quando comparado com o caso dos óbitos. Aqui não houve casos nem tão abaixo da média, nem tão acima. A figura 2, a seguir, faz o mesmo exercício da figura anterior através dos dados da porcentagem de votação no Presidente.
No próximo capítulo, aprenderemos a transformar o número em termos de desvios padrões e comparar a um número especial chamado “z”. Até breve.
No próximo capítulo, aprenderemos a transformar o número em termos de desvios padrões e comparar a um número especial chamado “z”. Cada Estado terá um número correspondente para ser posicionado de maneira mais precisa nessa “régua do desvio”Até breve.