A interpretação de técnicas estatísticas

A interpretação de técnicas estatísticas é um dos grandes mistérios para muitos pesquisadores e estudantes. No entanto, um conjunto muito grande de técnicas estatísticas partem de princípios matemáticos e metodológicos singulares.

A estatística paramétrica, a mais utilizada, utiliza o princípio de que os dados devam construir um modelo linear para a compreensão dos fenômenos observados e analisados. Trata-se de criar uma reta para explicar a totalidade das observações. As técnicas de correlação linear utilizam esse princípio com veemência, uma vez que a direção da reta, se subindo ou descendo e o grau de inclinação da mesma, indicam a direção e a intensidade do fenômeno. Todas as técnicas paramétricas irão gerar três dados muito importantes para a interpretação e que são conceitos que devemos nos familiarizar em nossa labuta científica: 1) Probabilidade calculada; 2) Estatística do teste e 3) Grau de liberdade.

Todo p calculado por qualquer técnica estatística nos dá a informação da probabilidade observada pelo fenômeno analisado ocorrer devido ao acaso. Assim, quando temos um p = 0,06 isso quer dizer que a probabilidade da diferença observada ser devido ao acaso é de 6%. Por convenção científica, adota-se que uma probabilidade menor que 5% seja considerada de mais alto rigor possível para que possamos cometer algum erro de interpretação.

A Estatística do Teste é um símbolo matemático que reflete o quão intenso está sendo o fenômeno em análise. Em um teste-t, para comparação de duas médias, o símbolo da Estatística do Teste chama-se “t” e reflete o quão intenso é a diferença observada entre as duas médias em análise. Por conta de a estatística paramétrica ser formada por modelos lineares, podemos afirmar que quanto maior for o valor da Estatística de um Teste, menor será o p calculado pela técnica. Assim, quanto maior a diferença observada entre os dados em análise, menor a chance de cometermos um erro científico com valores de p calculado menores que 5%.

Por fim, o conceito de Grau de Liberdade reflete o número de réplicas independentes para podemos tirar conclusões sobre uma amostra. Se coletarmos somente uma observação, a média será igual ao valor observado, mas, no entanto, não teremos informações sobre o quão disperso é a situação da nossa população em relação à média. Assim, se coletássemos a altura de um único chinês e por acaso ele fosse 1,95m a confiança que teríamos sobre essa análise seria baixa e imaginaríamos os chineses muito parecidos com os Vikings! Porém, a medida que coletamos mais dados, poderíamos construir o padrão de dispersão dos dados em torno da média e poderia ser que nosso segundo chinês medisse 1,45m. Somando 1,95m + 1,45m e dividindo por dois para retirar a média aritmética teríamos 1,70m, que continua sendo uma população chinesa um pouco maior que o esperado. Entretanto, podemos perceber que com a nova média temos um indivíduo 25 cm maior que a média e outro 25 cm menor que a média. Então, teríamos definido um padrão de dispersão dos dados em torno da média. Se essa amostra fosse relativamente grande, poderíamos esperar encontrar alturas de chineses 25 cm acima ou abaixo do valor da média como um padrão esperado para essa população. Assim, à medida que aumentamos o número de observações, também aumentamos o nosso Grau de Liberdade e a confiança com a qual podemos inferir sobre os fenômenos analisados por nossa amostragem.

Quer saber mais sobre Estatística!? Acompanhe nossas postagens semanais!

Dúvidas e sugestões?! Fique à vontade para nos contactar!

Alexandre Azevedo é biólogo formado pela UFMA e especialista em Gestão Ambiental e Responsabilidade Social pela ENE. Ministra cursos e treinamentos de Bioestatística para a área das Ciências Biológicas e da Saúde.

#bioestatística #meioambiente #saúde

A interpretação de técnicas estatísticas

Posts recentes

ENTRE EM CONTATO

POLÍTICAS DO SITE