Por Gilson Fernandes Filho
Estudante de Graduação em Medicina da UFPB (III Período) e Monitor do Módulo Pesquisa Aplicada à Medicina (MCO2)
O Teorema do Limite Central é um dos teoremas mais importantes da estatística e probabilidade, constituindo a base para a estatística inferencial com base na distribuição normal.
O Teorema afirma que a soma de muitas variáveis independentes aleatórias e com mesma distribuição de probabilidade sempre tende a uma distribuição normal. Para uma amostra suficientemente grande, a distribuição de probabilidade da média amostral pode ser aproximada por uma distribuição normal, com média e variância iguais às da população.
Essa ideologia funciona do seguinte modo: dada uma população, com qualquer tipo de distribuição de variáveis, que possua uma média “μ” e um desvio-padrão “σ”, deve-se tirar várias amostras de tamanho “n” dessa população e analisar a distribuição das médias de cada amostra. Desta forma, o que ocorre é o seguinte:
· Inevitavelmente, a distribuição dessas médias amostrais tende a uma distribuição normal, à medida que o tamanho”n” da amostra aumenta.
· A média das médias amostrais tenderá à média populacional:
· O desvio padrão das médias amostrais é o erro-padrão da média
Na prática, sempre que a amostra for maior que 30 (n > 30), essa distribuição de médias amostrais se aproxima de modo satisfatório a uma distribuição normal.
É interessante notar que a curva de distribuição da população geral não interfere para obtenção da distribuição normal da amostra. A população pode ter distribuição uniforme, assimétrica ou normal, que sempre ao se realizar a divisão da população em amostras e analisar suas medias, aproximar-se-á de uma distribuição normal.
O Teorema do Limite Central está intimamente associado à idéia do Intervalo de Confiança. O Intervalo de Confiança se conceitua como a amplitude, o intervalo de valores que tem determinada probabilidade de conter o valor verdadeiro da população. Assim, com a separação da população em amostras distintas de mesmo tamanho, verifica-se uma distribuição normal das médias. Assim, pode-se verificar aquelas médias que não se adéquam como representativas da população.
Aí surge também o conceito de nível de confiança, que se refere à probabilidade do intervalo de confiança conter o valor verdadeiro do parâmetro populacional. Ou seja, por exemplo, a partir de uma população, separamos 100 amostras de mesmo tamanho. A união de todas as médias do parâmetro requerido formará uma curva de distribuição normal.
Se quisermos determinar um intervalo de confiança que possua x% de confiança, isso quer dizer que em x% das 100 amostras o parâmetro fazia parte do intervalo. Ou seja, terá 95% de confiança o intervalo que contém o parâmetro de 95 dessas 100 amostras. Assim, para uma significância de 5%, os parâmetros das 5 amostras que não pertencem a esse intervalo não são representativos da população e o intervalo de confiança se obtém a partir dos valores máximo e mínimo ideais determinados pelo nível de confiança.
Portanto, o Teorema se mostra como essencial para a análise estatística, principalmente de populações que não apresentam distribuição normal e com um tamanho suficiente.
Referências
CANCHO, V, G. Noções de Estatística e Probabilidade. Universidade Federal de Ouro Preto, Departamento de Matemática. Ouro Preto, 2004. P. 109.
MEYER, P, L. Probabilidade - Aplicações à Estatística. 2ª Ed. Livros Técnicos e Científicos Editora S.A. Rio de Janeiro, 1983.
Crédito da imagem: A figura desta postagem foi retirada de: