Óbitos e votos: um estudo didático com os dados da COVID-19 no Brasil
Paulo Wenderson Teixeira Moraes
Prof. Adjunto UNEB
Psicologia
08 /06/2021
Capítulo 3: A Curva Normal
Os dados obtidos para uma análise podem ser agrupados em termos da frequência com que surgem dentro de classes de resultados, como foi visto no caso das notas escolares, no capítulo 2. Para observar esse agrupamento, surgiram os gráficos de barras que fornecem uma boa visualização da distribuição dos dados. O gráfico 5, a seguir, foi construído com dados fictícios da altura dos homens brasileiros, baseado em dados originais do IBGE, segundo os quais a altura média do homem brasileiro é de um metro e setenta e três centímetros (1,73 metros ou 173 centímetros). De um total estimado de 100 milhões de homens, observa-se que a sexta maior barra se encontra na altura de 170 centímetros(1,70m), correspondendo à 6,8 milhões de indivíduos nessa condição.
Para saber a probabilidade da Branca de Neve sortear um desses príncipes encantados de 1,70m, nessa população, basta dividir a quantidade de elementos desse subgrupo pelo número total de indivíduos da população de homens: 6,8 / 100 = 0,068, ou seja, quase 7 por cento de chance de sortear um deles ao acaso. Se ela for menos exigente e disser que ele tem que ter apenas uma altura igual ou superior a essa, a operação é mais demorada, porém é tão simples quanto. Soma todos os valores das barras superiores a 169 centímetros, que corresponde à quantidade de indivíduos classificados com altura de 170 centímetros ou mais. A conta é essa: 6,8 + 7,3 + 7,5 + 7,6 + 7,5 + 7,3 + 6,8 + 6 + 5 + 4 + 3 + 2 + 1,5 + 1 + 0,6 + 0,4 + 0,3 + 0,2 + 0,1 + 0,08 + 0,06 + 0,04 = 0,7508. Colocando em palavras, a Branca de Neve tem 75% de chance de sortear ao acaso um homem de estatura igual ou superior à 1,70 metros nessa população de brasileiros. Para o lado contrário, se ela desejasse alguém mais baixo do que ela, então teria que fazer o somatório das colunas que estão à esquerda dessa altura. Pode fazer o exercício para conferir, mas tenho a impressão de que o resultado será de 25%, pois já achamos a percentagem anterior e sabemos que o total é 100, então 100 – 75 = 25. Como pode ser visto no gráfico 6, a área das barras corresponde a essas percentagens, demonstrando que é possível determinar as regiões do gráfico que correspondem a percentagens específicas. Observa-se também uma simetria ao dividir o gráfico no meio e uma curva pode ser traçada facilmente.
Gráfico 5: histograma estimado da altura do homem brasileiro
Esses gráficos foram feitos de maneira a mostrar um desenho bem próximo de uma curva normal perfeita. No gráfico 7, observa-se duas áreas representadas, uma à esquerda e outra à direita. Elas são iguaizinhas e mostram que é mais difícil encontrar uma pessoa com mais de 182 centímetros e abaixo de 165 centímetros. Apenas 4,3% dos indivíduos se encontram acima e outros 4,3% se encontram abaixo.
Se a Branca de Neve quisesse reunir seus anões teria alguma dificuldade. Eles se encontram tecnicamente abaixo de 145 centímetros e nem aparecem nos gráficos. Para fins práticos, podemos considerar “anões” aqueles que possuem altura menor que a última quantidade presente no gráfico, 155 centímetros, lembrando que não se calcula um ponto específico de probabilidade de ocorrência, mas um intervalo para se chegar a uma porcentagem. Então, 0,4/100 = 0,004. Isso significa que a chance de ela sortear um “anão” entre os 100 milhões de homens é de 0,4 por cento, ou seja, para cada 1.000 homens, há 4 “anões”. Fazendo a conta: 1.000/4 = 250, chega-se a 1 “anão” para cada 250 homens. Para encontrar a probabilidade de sortear os 7 “anões”, basta multiplicar esse valor 7 vezes: 250 x 7 = 1750, ou seja, para cada 1750 homens, existem 7 deles abaixo de 156 centímetros de altura. Quanto mais baixo ou mais alto é a pessoa, mais difícil é encontrá-la, pois elas se perdem entre os milhões que estão mais próximos da média.
Fenômenos que se expressam em grandes números revelam essa tendência central em torno de uma média. Quanto mais distante da média, mas raro vai se tornando o acontecimento observado. Estudando a distribuição das frequências de muitos fenômenos, uma regularidade se revelou impressionante: quando somamos e diminuímos um desvio padrão da média, se estabelece um intervalo dentro do qual se encontram cerca de 68% das observações de fenômenos que obedecem à distribuição normal. Se somarmos e diminuirmos dois desvios da média, outro intervalo se manifesta com cerca de 95% dos casos de uma determinada variável. Por fim, no terceiro desvio padrão para mais e para menos, o intervalo contém praticamente a totalidade dos dados: 99,9%. Seria necessária uma matemática mais avançada, que não domino, para compreender por que o universo se manifesta dessa forma. Mas podemos nos deliciar em encontrar a curva normal descrita no gráfico 8 nos mais inusitados fenômenos.
A curva se parece com um sino e esse tornou-se o seu nome popular. “Muita gente” vê sinos e curvas normais para onde quer que olhe, até mesmo num pôr do sol. Quando “essa gente” é estatístico então, resolve-se facilmente o enigma proposto pelo pequeno príncipe de Antoine de Saint-Exupéry (1994). Observe a figura a seguir. O que você vê?
Figura 2: O Chapéu?
Fonte: (DE SAINT-EXUPÉRY, 1994)
O pequeno príncipe apresentou a interpretação alternativa dessa curva normal como se dentro dela tivesse um elefante, que teria sido engolido por uma suposta jiboia. Uma imaginação muito criativa e lúdica, mas na verdade se tratava da ingestão muito rara de uma curva normal, que foi engolida acidentalmente por uma jiboia. Um pouco deformada pelas contorções estomacais dessa cobra, é claro, mas, ainda sim, uma curva quase simétrica em forma de um sino. Outra explicação concorrente a essa é que o sino caiu de uma torre bastante alta numa igreja abandonada na floresta amazônica, sendo depois consumido pela diligente cobra com tendências estatísticas. Para tentar confundir o leitor, na figura 3, o elefante se apresenta de maneira convincente, mas depois de treinamento estatístico, é mais difícil embarcar em fake news! Antigamente, muitos confundiam a figura com um chapéu, entretanto, depois de meditar no fenômeno da curva normal, não restam mais dúvidas.
Figura 3: O elefante engolido pela jiboia?
Fonte: (DE SAINT-EXUPÉRY, 1994)
Essa foi uma interpretação bastante forçada do pequeno príncipe, pois existem muitas alternativas para compreender esse fenômeno natural da ingestão espontânea da estatística. Vamos mudar o foco e olhar para paisagens. Na figura 4, a seguir, um belíssimo pôr do sol em preto e branco revela a concentração dos raios no centro, que representa a média. Na medida em que dirigimos o olhar para as extremidades, a luz diminui gradativamente. Uma autêntica curva em forma de sino. Para os incautos, fui obrigado a traçar a curva normal no pôr do sol na figura 5, profanando uma ideia abstrata com um traço grosseiro da materialidade que revela um real empobrecido pela didática do professor.
Figura 4: O pôr do sol
Fonte: Foto da autor, Gamboa de Cima, Salvador-Ba
Para os incautos, fui obrigado a traçar a curva normal no pôr do sol na figura 5, profanando uma ideia abstrata com um traço grosseiro da materialidade que revela um real empobrecido pela didática do professor.
Figura 5: Curva normal ao Pôr do sol na Gamboa de Cima, Salvador-BA,
Fonte: Acervo da autor
Continuando nosso passeio pela natureza, a formação de uma pedra também pode acompanhar a forma de um sino. A Pedra Azul localizada em Domingos Martins, no Espírito Santo, é um exemplo clássico de montanha de pedra que escolheu para si a forma de uma curva normal. Na figura 6, pode conferir com seus próprios olhos:
Figura 6: A curva normal em forma de sino se manifestando na Pedra Azul, em Domingos Martins-ES
Fonte: Acervo do Autor.
Voltando do nosso voo xamânico pelos delírios da mente fértil do escritor, é possível visualizar o fenômeno da tendência para a média quando observamos o desgaste que acontece pela utilização de um piso ou terreno. Por exemplo, o desgaste que forma uma trilha no meio de uma mata. Observa-se uma tendência de as pessoas trafegarem, a pé ou de bicicleta, pelo meio de uma via de terra, gerando o caminho bem delimitado no meio, que corresponde à média. Poucas pessoas caminham pelas beiradas e o terreno ali não se desgasta tanto e a vegetação se recompões mais facilmente. Portanto, na figura 7, mais uma vez é possível visualizar esse fenômeno da tendência ao centro.
Figura 7: A trilha e a tendência a trafegar pelo centro
Fonte: Arquivos do autor
Em estradas, os carros em média trafegam dentro de uma tendência. Ali onde os pneus mais passam cria-se uma deformação. Mas eles não passam exatamente no mesmo lugar, mas dentro de uma faixa que varia num limite de segurança, para não ir demasiadamente para esquerda e provocar um acidente ou demasiadamente para a direita e sair pelo acostamento da estrada. Avançando gradativamente para fora da deformação, o asfalto se desgasta menos. Na figura 8, observamos uma via de asfalto na qual a parte mais clara está mais desgastada, pois os quatro pneus passam predominantemente dentro de um espaço que mantém o automóvel na mão adequada para evitar o choque com os carros que trafegam em sentido contrário. A faixa de asfalto que está mais escura é por onde raramente o pneu de um carro passa. Indo para as extremidades, o tráfego é menos provável, o que leva a menos desgastes da pista.
Figura 8: Estrada e o desgaste do tráfego
Fonte: arquivos do autor
Cada passagem de um pneu é uma excelente analogia para a ideia de um experimento no qual observamos algum fenômeno. Geralmente não é possível observar todos os pneus que vão passar pela pista, assim como é impossível observar, de maneira onipresente, do início ao fim, qualquer que seja a variável que um cientista esteja utilizando. Uma forma mais prática de observar é retirar uma amostra reduzida de uma população para fins de análise e produção de informações úteis. No exemplo da altura do brasileiro, é um tanto quanto inviável medir a altura de todos os indivíduos da população. Mas uma amostra mais razoável de cinco mil pessoas é uma tarefa executável com algum empenho. Os estatísticos descobriram uma informação bastante útil: na medida em que mais amostras são extraídas de uma população, o conjunto delas tende a expressar a média real. Para não repetir infinitamente o processo de amostragem, eles sistematizaram o Teorema Central do Limite. Assim, a média das médias das amostras tende a corresponder à média da população. Como ninguém em sã consciência brinca de ficar fazendo amostras, uma dedução lógica do Teorema é que quanto maior for a amostra, maior é a probabilidade de encontrar uma média mais próxima da média da população. Foi assim que Silva e Monteiro (2009) encontraram, numa amostra de 5305 homens entre 15 e 87 anos de idade nos 20 principais aeroportos do país, a média de estatura de 173,1 centímetros (1,73m) de altura. Um dos segredos para cravar essa média igual à da população de homens, em torno de 100 milhões de indivíduos, é construir uma boa amostra. Para isso, é necessário evitar escolher as pessoas por alguma preferência e utilizar algum critério ao acaso. Por exemplo: medir as pessoas durante quatro horas de embarques, em aeroportos nas capitais dos Estados brasileiros, até atingir um número razoável de medições.
Por que alguém se daria ao trabalho de medir tais pessoas, hein Silva? Esse estudo buscou conhecer as medidas dos brasileiros que viajam de avião e assim determinar um tamanho adequado de poltrona para atender ao maior número possível de passageiros de uma maneira confortável. Para aqueles que são muito altos, poderia ter uma ou duas poltronas especiais. Dificilmente embarcam mais de dois grandalhões de 2 metros de altura por voo, a não ser que seja um time de basquete indo para algum torneio em outro Estado. Nos anexos desse trabalho, encontra-se o esboço de uma curva normal da amostra. O gráfico 9, a seguir é uma reprodução de um gráfico retirado de lá (SILVA; MONTEIRO, 2009). Percebam que ele usou intervalos de 10 centímetros que levou a uma grande concentração dentro das classes de altura (160-170; 170-180; 180-190). Se houvesse um pouco mais de esforço, construindo classes com intervalos menores de altura, o resultado seria mais elegante e as barras acompanhariam graciosamente a curva guia.
Gráfico 9: Distribuição dos Dados de Estatura dentro da Curva de Normalidade Esperada
Fonte: (SILVA; MONTEIRO, 2009)
Caminhando para as extremidades, as estaturas vão se tornando raras. Pode-se dizer que a quase totalidade se encontra entre 160 e 190 centímetros. O menor sujeito encontrado tinha 144 centímetros e o mais alto 200 centímetros. O desvio padrão foi de 7,3 centímetros. Aplicando aquela ideia de somar e diminuir o desvio padrão da média, encontramos os seguintes intervalos:
Figura 9: Porcentagem de homens de acordo com o intervalo de 1, 2 e 3 desvios padrões em relação à média.
Observando a figura 8, podemos ter uma ideia aproximada de que a maior parte dos homens terá entre 165 e 181 centímetros de altura. Assim, é possível projetar assentos mais adequados à população brasileira.
Vamos concluir esse capítulo por aqui, pois fiquei muito contente com a ausência de temas que nos trazem sentimentos de tristeza e luto. Por um instante contemplamos o pôr do sol e revisitamos o pequeno príncipe. Um refresco para o que há de vir no capítulo 4: o número “z”.
Referências:
BATESON, G. Steps to an Ecology of mind. Chicago: The University of Chicago Press, 1999.
DE SAINT-EXUPÉRY, A. O pequeno príncipe. Rio de Janeiro: Agir, 1994.
DURKHEIM, E. O suicídio: estudo sociológico. São Paulo: Editorial Presença, 1982.
FIELD, A. Descobrindo a estatística usando o SPSS. 3 ed. Porto Alegre: Artmed, 2009.
FIELD, A. Discovering statistics using SPSS. 5 ed. London: Sage, 2013.
GOETHE, J. W. Os sofrimentos do jovem Werther. Porto Alegre: L&PM, 2010.
MERLLIÉ, D. Suicídios: modos de registros. In: BESSON, J.-L. (Ed.). A ilusão das estatísticas. São Paulo: UNESP, 1995. p. 113-134.
MORAES, P. W. T. M. Psiquê e as cartas mágicas. Salvador: DaIN, 2020.
SILVA, S. C. D.; MONTEIRO, W. D. Levantamento do perfil antropométrico da população brasileira usuária do transporte aéreo nacional: projeto conhec er. Agência Nacional de Aviação Civil,. 2009.