27 de novembro de 2010

Margem de Erro em Pesquisas Clínicas

Por Priscilla Duarte Ferreira
Estudante de Graduação em Medicina da UFPB
Resumo

A diferença entre o valor da estatística obtida na amostra e o verdadeiro valor do parâmetro que se deseja estimar na população é denominada margem de erro. As pesquisas, principalmente nas ciências biológicas, têm como objetivo produzir resultados cada vez mais precisos e menos suscetíveis a erros. A margem de erro, além de conferir certa credibilidade às pesquisas, é útil na determinação de intervalos de confiança e do tamanho da amostra necessários ao estudo em questão.

Palavras-chave: Estatística. Amostragem. Intervalos de Confiança. Diante da inviabilidade de se pesquisar todo o universo, a população para qual a pesquisa é dirigida, devido à onerosidade do próprio processo é preferível optar pelo processo de amostragem.
Contudo, a pesquisa não tem uma amostra que seja inteiramente semelhante à população, ocorrendo disparidades por flutuações amostrais aleatórias. O valor absoluto obtido da diferença entre a média da amostra (X) e o verdadeiro valor do parâmetro que se deseja estimar na população (μ) é denominado margem de erro, erro amostral ou de amostragem. Assim, pode-se representar: Erro de Amostragem = X – μ
O objetivo da amostragem é permitir inferências de características de uma população com base em apenas alguns de seus elementos. Assim como não é preciso incluir no estudo toda a população-alvo de um dado medicamento para se testar sua eficácia, também não é viável coletar todo o sangue do paciente para o exame, sendo suficiente apenas um tubo de ensaio pra que um laboratório realize as análises clínicas.
O estudo de apenas uma parte de um todo é respaldado por três princípios: Probabilidade, Causalidade e Lei dos Grandes Números.
O primeiro refere-se ao fato de que a proporção entre os sucessos e o número total de testes ou exames representa o que na teoria é chamado de “grau de confiança”, que indica a probabilidade de que a amostra escolhida represente bem o todo que se queria estudar ou inferir.
O segundo é relacionado à necessidade de se garantir a casualidade na escolha, ou seja, que cada elemento da amostra tenha a mesma probabilidade de ser escolhido sem que haja tendenciosidade.
O terceiro princípio pressupõe que os desvios da verdade devem ocorrer ao acaso: algumas vezes em uma direção e outras na direção oposta. Assim, na totalidade da amostra os desvios acabam se anulando. Se esta premissa não for satisfeita, então os resultados da pesquisa serão distorcidos.
Nos casos de universo impossível de ser analisado exaustivamente, elemento por elemento, a escolha pela amostra é inevitável, e assim também o erro amostral. Afinal, utilizando uma fração da população existe certo grau de incerteza sobre o real valor da estimativa que se faz. Assim, quanto mais homogênea é uma população, menor o erro de amostragem (ver figura acima). Calculada a média da amostra retirada de uma população, não se pode inferir que a média amostral é igual à média populacional. Surge então o conceito de Intervalo de Confiança (IC), cujo objetivo é definir com grau de certeza que a verdadeira média da população esteja em um intervalo ao redor da estimativa encontrada, a média da amostra.
Quanto menor esse intervalo, mais preciso e maior o tamanho da amostra necessária. O tamanho da amostra, assim como o IC, depende do nível de precisão desejado, o quanto o pesquisador admite errar (margem de erro tolerável). Uma das utilidades dos intervalos é dar a idéia da dispersão ou variabilidade das estimativas. IC = μ ± ε Onde:
ε - Erro amostral tolerável ou margem de erro; ε = Z a/2 σ/ Z - O z-score reduzido, valor crítico da distribuição, associado a um grau de confiança; σ - O desvio-padrão da população, sendo conhecido através de estudos anteriores. O IC permite incorporar uma probabilidade de erro. Esta é inferida a partir de um conhecimento do modelo de distribuição de frequências do fenômeno estudado.
O modelo que mais habitualmente se ajusta à ocorrência de fenômenos biológicos, sendo por isso usado nas pesquisas clínicas, é o de distribuição normal, cujo intervalo de confiança envolve para sua construção o conhecimento da variância (que permite o cálculo do desvio-padrão).
Os intervalos podem ser construídos com diferentes coeficientes de confiança (α), sendo em geral mais utilizados em pesquisas clínicas os intervalos de confiança de 95%. Cada coeficiente corresponde um valor crítico da distribuição (Z a/2), que é uma medida de distância da estimativa pontual que se expressa em unidades de desvios padrão (PAES, 1998). A metade da amplitude do intervalo de confiança, chama-se margem de erro. Como, de um modo geral, o que se pretende é obter um intervalo de confiança com pequena margem de erro, por exemplo e, se pretendermos uma determinada confiança, por exemplo 95%, temos que recolher uma amostra de dimensão n = (1.96 . a/e )2. O nível de confiança, teórico e definido antes de serem atribuídos o valor da amostra, indica a probabilidade de que o IC contenha o verdadeiro valor da média população (μ).
O nível de confiança 95%, por exemplo, corresponde ao intervalo situado entre μ-2σ e μ+2σ. Isso significa que repetindo-se o mesmo evento 100 vezes, a média real da população estaria em 95 vezes dentro dos valores do IC, ou seja , distante da média (μ) 2σ para esquerda e para direita.
É comum em artigos médicos os valores de medidas estarem expressos na forma de médias mais ou menos desvio padrão, como por exemplo 87,5±4,8 ( margem de erro de 4,8, para mais ou para menos).
Este cálculo corresponde a se criar um intervalo de confiança de 65%, correspondente ao valor crítico de 1 desvio-padrão, e leva a um intervalo muito menor do que o habitual IC de 95%, cujo valor crítico é de aproximadamente 2σ (PAES, 1998).
Além de determinar um IC, a margem de erro também tem função na determinação do tamanho da amostra, cálculo que é imprescindível para qualquer pesquisa de qualidade.
Através da fórmula geral, o tamanho da amostra depende do grau de confiança (que está associado a coeficiente de segurança e um score crítico, sendo em geral utilizado 0,05 e 1,96, respectivamente) desejado, da margem de erro pretendida (e) e do σ. A partir da fórmula é possível observar que quanto maior a margem de erro tolerável no estudo em questão, menor o tamanho da amostra necessária.
Portanto, para que o resultado seja o mais confiável possível, com menor margem de erro, é necessário selecionar um tamanho maior de amostra. Na prática, uma maior margem de erro vai sugerir uma menor confiança na veracidade dos resultados, ou seja, a impossibilidade de os mesmos serem generalizados para a população amostrada.
Em suma, em qualquer pesquisa há a necessidade de se tentar diminuir a margem de erro que lhe é inerente para se obter inferências mais exatas.
Referências
PAES, A. T. Itens essenciais em bioestatística. Arq. Bras. Cardiol., São Paulo, 71 (4), online 1998. Disponível em http: script="sci_arttext&pid=S0066-782X1998001000003&lng=en&nrm=iso". Acesso em: 22 nov. 2010. SANTOS, G. R.; ABBUD, E. L.; ABREU, A. J. Determinação do tamanho de amostras: uma introdução para novos pesquisadores. Disponível em: http://www.fadminas.org.br/symposium/9_edicoes/artigo_8.pdf Acesso em: 22 nov. 2010. CREPALLI, M. S. Técnicas e Analíses Experimentais. Disponível em: http://www.fag.edu.br. Acesso em: 22 nov. 2010 MBILtda (Org.). Amostragem em Pequisa. Disponível em: http://www.mbi.com.br/MBI/biblioteca/tutoriais/amostragem. Acesso em: 21 nov. 2010. Fonte da imagem: pophealthmetrics.com