Prova do Grupo 1 - 10/05/2010
Quesitos
1- O que é nível de significância? E a que tipo de erro estatístico o nível de significância se refere?
2- Os resultados de uma triagem de acuidade visual de 411 crianças escolares feita por professores de ensino básico foram comparados com os realizados do exame feito por oftalmologistas, nas mesmas crianças. Os achados foram os seguintes: verdadeiros positivos (56 alunos), falsos positivos (5 alunos), falsos negativos (48); verdadeiros negativos (302). Monte uma tabela 2x2 e calcule os parâmetros que expressam validade do exame
3- O que significa associação espúria? Exemplifique.
4- O que expressa a reprodutibilidade de um teste diagnóstico e como se estima esta propriedade?
5- Classifique os tipos de dados das variáveis abaixo:
a) Pressão arterial; b) Grau de satisfação com o atendimento no HULW/UFPB; c) Marca de analgésico; d) Renda familiar; e) Grau de temperatura corpórea.
6- Considerando-se os valores de nível de glicose no sangue (mg%) para a amostra de 10 pacientes: 237, 257, 161, 237, 176, 123, 218, 124, 161, 143. Calcule: a) Nível médio de glicemia; b) Nível mediano de glicemia; c) Desvio padrão da glicemia
7- Cite duas representações gráficas adequadas para resumir variáveis qualitativas e quantitativas.
8- Com o objetivo de avaliar a associação entre fatores prognósticos e a recuperação da capacidade de deambulação após cirurgia para correção de fratura de colo de fêmur, foi desenvolvido um estudo em que 500 pacientes com 50 anos ou mais, que sofreram cirurgia para correção de fratura de quadril, foram acompanhados após a alta por um ano através de consultas mensais no ambulatório do hospital. Os resultados estão na tabela abaixo.
IC 95%: Intervalo de confiança de 95%; p: nível de significância
Responda: (a) Qual é o modelo deste estudo? (b) Qual deve ter sido a medida de associação usada? (c) Interprete o valor das medidas de associação encontradas e dos valores de p (nível de significância).
9- A distribuição de pressões sanguíneas diastólicas para a população de mulheres entre 30 e 34 anos tem média 74,4 mmHg e desvio-padrão 9,1 mmHg. Deseja-se saber se a média dessa população é igual à pressão sanguínea diastólica média da população de mulheres diabéticas dessa faixa etária. Uma amostra de 10 mulheres diabéticas foi selecionada, obtendo-se uma pressão diastólica média de 84 mmHg. Suponha que as variâncias são iguais. Pede-se: a) Determine as hipóteses nula (H0) e alternativa (H1); b) Elabore um teste de hipóteses para verificar se as pressões médias das duas populações são diferentes, assumindo um nível de significância de 5%
10- O que significam “randomização” e “mascaramento”?
Prova do Grupo 2 - 17/05/2010
Quesitos
1- Classifique as variáveis quanto ao seu nível de mensuração: a) Uma lista de diferentes especialidades médicas; b) Classificação do estágio de câncer de mama em tipos I, II, III ou IV; c) Pressão arterial diastólica, medida em mmHg; d) Etnia dos pacientes; e) Número de sessões de diálise realizadas em um mês; f) Número de crises de hipertensão nos últimos 12 meses.
2- Qual o propósito de um teste de hipótese? Explique.
3- Para estudar o problema de pesquisa “Perda fetal associada com ingestão de cafeína durante a gravidez” um pesquisador avaliou um grupo composto por 80 mulheres grávidas que consumiram 151 mg de cafeína/dia ou mais, no qual foi verificada uma frequência de 13 abortos espontâneos. Comparando esses resultados com o percentual de abortos espontâneos de 9% em mulheres não consumidoras de cafeína, conforme referido na literatura, e assumindo a aproximação normal da distribuição binomial, elabore uma conclusão a respeito da relação entre consumo de cafeína na gravidez e perda fetal, pede-se: a) Teste a diferença entre o resultado experimental e a literatura; b) Elabore a sua conclusão considerando um nível de significância de 5%.
4- Quando a área de aceitação da Hipótese Nula aumenta: a) O erro tipo I aumenta? b) O erro tipo II aumenta?
5- Qual a diferença entre média e mediana? Em que situação você utilizaria a mediana e não a média?
6- Formule um problema de pesquisa (tema de livre criação) para um delineamento (modelo) de estudo caso-controle.
7- O que é acurácia de um teste diagnóstico e que modelo de pesquisa melhor avalia esta propriedade?
8- Um estudo de coorte com 3.000 fumantes e 5.000 não fumantes mostrou os resultados apresentados na tabela abaixo:
- Calcule a medida de associação indicada para doença coronariana com relação ao hábito de fumar.
9- Um pesquisador, investigando a incidência de Doença da Membrana Hialina, escolheu como amostra os primeiros 200 partos ocorridos nas quartas-feiras no Serviço de Obstetrícia do HULW/UFPB. Com base nessa amostra, determinou a incidência da referida doença no berçário escolhido e extrapolou para a população de João Pessoa. Este procedimento merece críticas? Justifique.
10- O que são “intervalo de confiança” e “erro amostral” e qual a relação entre os dois conceitos?
I- Resolução da Prova do Grupo 1
1- A significância estatística é uma ferramenta matemática utilizada em análise inferencial dos dados para determinar se os resultados encontrados em uma pesquisa empírica decorre de uma relação real entre variáveis ou se essa relação se deve apenas ao acaso. Uma diferença observada entre médias de duas amostras aleatórias, por exemplo, é descrita como estatisticamente significativa quando a probabilidade de obtenção de tal diferença só pelo acaso é relativamente baixa. Adotando-se o nível de significância convencional (alfa ou p) de 0,05, o resultado será considerado estatisticamente significativo quando a probabilidade de se dever ao acaso for menor que 5% e, nesse caso, não haveria diferença entre os grupos que estão sendo comparados.
A palavra "significância", em estatística, tem um significado inteiramente distinto do seu significado usual. Além disso, se a diferença encontrada nos dados é estatisticamente significativa, não significa que ela é biologicamente ou clinicamente importante ou interessante. Assim, a significância estatística de um resultado é a probabilidade de que a relação observada, por exemplo, entre variáveis, ou a diferença entre as médias ou proporções, em uma amostra, ocorreu por puro acaso, e que na população de onde essa amostra foi retirada, não há realmente relação ou diferença. Trata-se, portanto, de uma probabilidade. Resumindo, o valor p, ou nível de significância observado, é uma medida da plausibilidade dos resultados da amostra quando a hipótese nula é assumida como verdadeira. Quanto menor o valor p, menos provável é que os resultados da amostra venham de uma população onde a hipótese nula é verdadeira.
2- Sensibilidade = a/ac = 56/56+48 = 56/104 = 0,538 = 0,54 = 54%; Especificidade = d/b+d = 302 / 302+5 = 0,98 = 98%.
3- É uma relação estatística na qual duas variáveis não têm uma associação causal direta, havendo um terceiro fator, relacionando com as duas que aparecem associadas, e que é a real causa da associação encontrada. A relação espúria dá a impressão da existência de um vínculo entre duas variáveis, mas se trata de uma associação falsa. Uma associação espúria ocorre quando x e y são influenciadas por outra (s) variável (is). Se o enquadramento teórico do estudo não for o correto, é fácil chegar a conclusões erradas porque os resultados estatísticos são espúrios. Um exemplo de uma de uma associação espúria é a associação estatisticamente significativa entre cessação do tabagismo e morte. Muitos tabagistas que já estão com doença avançada relacionada ao cigarro deixam este vício e morrem pouco depois. Nesse caso, a associação encontrada entre cessação do hábito de fumar e a morte é espúria, porque os pacientes que deixaram de fumar já estavam muito doentes. Há aqui uma terceira variável escondida, que pode provocar uma associação estatisticamente significativa, mas totalmente espúria, falsa.
4- A reprodutibilidade é a consistência ou stabilidade das medidas, ou seja, o grau em que as medidas ou observações efetuadas pelo mesmo observador/instrumento ou por outros observadores/instrumentos são concordantes, mantidas as mesmas condições. Em estatística, reprodutibilidade refer-se à confiabilidade e fidedignidade de uma medida ou exame ou teste. Esta propriedade pode ser estimada pela comparação inter-observadores ou intra-observador através do teste Kappa (variáveis nominais) ou uma análise de correlação (variáveis ordinais ou contínuas).
5- (a) Contínua; (b) ordinal; (c) nominal; (d) contínua; (e) contínua.
6- a) Nível médio de glicemia = 183,7; b) nível mediano de glicemia = 168,5; c) desvio-padrão da glicemia = 43,9
7- Qualitativas: gráfico de setores e gráfico de barras; quantitativas: diagrama de caixas e gráfico de barras.
8- (a) Coorte; (b) risco relativo; (c) 48 h ou mais: não houve associação; menos de 48h: a probabilidade de ocorrência de recuperação foi quatro vezes maior, e esta associação foi significativamente estatística (p = 0,01).
9- O erro padrão da média é 2,88 e o valor de z calculado é 3,34, correspondendo a p=0,0009. Logo, para um nível de significância de 1%, as médias entre os dois grupos são estatisticamente diferentes. O teste será bicaudal.
10- Randomização: De random, em inglês, derivam o verbo randomizar, com o seu particípio randomizado, e o adjetivo randômico. Em seu sentido mais simples, randomização é o que acontece quando uma moeda é lançada, ou um nome em um pedaço de papel é retirado de uma urna às cegas. O equivalente vernáculo do verbo randomizar poderia ser casualizar, acidentalizar,ou aleatorizar. um arranjo aleatório de observações deliberadamente, de modo a simular a chance randomização ajuda a aumentar a comparabilidade dos grupos de tratamento. Quando dois grupos são selecionados aleatoriamente da mesma população, ambos são representativos desta . Eles não são apenas estatisticamente equivalentes à população, mas também são estatisticamente equivalentes entre si. A mesma lógica se aplica quando dois grupos são escolhidos aleatoriamente. Isso é chamado de atribuição aleatória. Designação aleatória é o elemento chave da avaliação ao acaso, representando um um princípio fundamental da teoria estatística. Mascaramento ou cegamento é a prática de não dizer aos participantes de uma pesquisa se eles estão recebendo uma medicação ativa ou um placebo. Desta forma, os indivíduos dos grupos controle e tratamento de experimentar o efeito placebo da mesma forma. Muitas vezes, o mascaramento de que o grupo receberá placebo ou a medicação também é mantido por analistas que avaliam a experiência. Esta prática é chamada de cegueira dupla, e o ensaio de duplo-cego.
II- Resolução da Prova do grupo 2
1- (a) Nominal; (b) ordinal; (c) contínua; (d) nominal; (e) discreta; (f) discreta.
2- A finalidade dos Testes de Hipóteses é avaliar afirmações sobre os valores de parâmetros populacionais a partir de uma amostra da população. Nos estudos analíticos, além da descrição estatística, às vezes é necessário tomar uma decisão. O teste de hipóteses é um procedimento estatístico que tem por objetivo ajudar o pesquisador, a tomar uma decisão em relação a uma população através da observação de uma amostra desta população. Uma hipótese estatística é uma afirmativa a respeito de um parâmetro de uma distribuição de probabilidade. Muitas aplicações de teste de hipóteses têm um objetivo de tomada de decisão. A conclusão rejeitar H0 fornece o suporte estatístico para concluir que H1 é verdadeiro e tomar a decisão apropriada, seja ela qual for. A declaração "não rejeitar H0" embora não conclusiva, pois há uma margem de erro (geralmente assumida como 5%) leva à decisão de que a hipótese alternativa não deve ser aceita, pois a probabilidade de esta ser real é muito pequena. Os testes de hipótese são uma das aplicações da estatística mais usadas. A regra do teste de hipóteses divide o espaço amostral em duas regiões: uma de rejeição e outra de não rejeição de Ho. A partição é, em geral, obtida utilizando-se uma estatística amostral. Região crítica (Rc) é o conjunto de valores assumidos pela variável aleatória ou estatística de teste para os quais a hipótese nula é rejeitada. Exemplo: Um pesquisador propõe um tratamento para combater a obesidade em uma população, que tem peso médio de 90 kg, consiste de exercícios físicos, dietas e ingestão de um medicamento. Ele afirma que com seu tratamento o peso médio da população diminuirá em 90% dos casos em um período de três meses. Neste caso as hipóteses estatísticas que deverão ser testados são: H0 = média igual a 90 e H1 = média menor que 90, onde 90 é a média dos pesos do homens em estudo após o tratamento. Esta é a forma mais clássica de inferência estatística e consiste em verificar se a informação estatística é suficientemente significante para rejeitar uma dada hipótese em favor de outra (que é, de fato, o que se pretende comprovar estatisticamente).
3- (a) Primeiro, faz-se a aproximação da binomial pela curva normal: média 80 x 0,09 = 7,2; desvio-padrão = raiz quadrada de 80 x 0,09 x 0,91 = 13. Calculando o valor de z, obtem-se z = 2,265, correspondendo a p = 0,0235. Logo, a chance de se observar a diferença ao acaso é menor que 0,05 e rejeitamos H0. (b) Conclusão: a proporção de abortos espontâneos em gestantes consumidoras de cafeína (151 mg por dia ou mais) é diferente da proporção esoerada em gestantes não consumidoras de cafeína (o teste foi bicaudal).
4- (a) Não; (b) Sim. O erro tipo I diminui, ou seja, será menor a probabilidade de se rejeitar a H0 e ela ser, de fato, verdadeira. O erro tipo II aumenta, pois será maior a probabilidade de se aceitar H0 e ela ser, de fato, falsa.
5- Média e mediana são ambas medidas de tendência central ou posição. A média é a medida descritiva que mais caracteriza a variável que está sendo analisada. Esta estatística (ou estimador) dá um quadro mais balanceado do conjunto de valores que assume dada variável, mas é afetada pelos valores extremos da distribuição. A mediana é o valor que, numa série de medidas, tem tantos valores acima quanto abaixo dela e, ao contrário da média, não é influenciada por valores extremos da série, nem se presta para análise inferencial. A mediana pode ser usada para dados de mensuração ordinal e contínua; a média é usada para dados de mensuração contínua. Deve-se usar a mediana, ao invés da média, quandoa distribuição dos valores analisados é assimétrica ou a variável é de nível ordinal.
6- Problema de pesquisa para um estudo caso-controle: O estudo caso-controle é um estudo epidemiológico observacional, longitudinal, geralmente retrospectivo, analítico, em que um grupo de casos, isto é, indivíduos com a doença (ou a condição em estudo), é comparado, quanto a exposição a um ou mais fatores, a grupo de indivíduos semelhante ao grupo de casos, chamado de controle (sem a doença). Exemplo do problema de pesquisa para este tipo de estudo: O consumo de álcool aumenta a chance de amputação de extremidades inferiores em pessoas com diabetes mellitus na rede de serviços do Município de João Pessoa/PB?
7- Entende-se por "acurácia" a proporção de testes verdadeiramente positivos e verdadeiramente negativos, em relação à totalidade dos resultados. Acurácia significa validade de uma medida ou exame ou teste. Portanto, a acurácia de uma estimativa é uma medida da correlação entre o valor estimado e os valores reais, ou seja, mede o quanto a estimativa que obtemos é relacionada com o "valor real" do parâmetro. Ela nos informa o quanto o valor estimado é "bom", ou seja, quanto o valor estimado é "próximo" do valor real e nos dá a "confiabilidade" daquela estimativa ou valor. [sobre acurácia neste weblog: http://semiologiamedica.blogspot.com/2008/12/diagnstico-probabilstico.html)]. O modelo de pesquisa para avaliar acurácia é o estudo transversal, em que se comparam os resultados do teste/exame/medida que está sendo avaliado com um padrão-ouro.
8- Risco relativo (RR) = [a/(a+b)]/[c/(c+d)] = [84/3000]/[87/5000] = 1,6. Interpretação: O risco de doença coronariana é 1,6 vezes maior, ou 60%, maior nos fumantes que nos não-fumantes.
9- A escolha de um dia específico da semana não foi apropriada para investigar a incidência da doença, pois esta se relaciona ao tipo de parto: a equipe do dia escolhido pode ser mais ou menos intervencionista (tende a indicar mais cesarianas que partos normais ou o inverso) do que as dos outros dias da semana, interferindo nos resultados e constituindo um viés de seleção. Além disso, todos os recém-nascidos do berçário não tiveram a mesma chance de fazer parte da amostra, portanto, o pesqusiador não pode generalizar os resultados da sua pesquisa para a comunidade, pois nem todas as gestantes desta são usuárias deste mesmo serviço.
10- Um intervalo de confiança de uma estimativa expressa o nível de precisão de que a média (ou outra estatística) encontrada em uma amostra se encontra dentro daquele intervalo na população. O erro padrão é uma medida da precisão da média amostral calculada, sendo obtido dividindo o desvio padrão pela raíz quadrada do tamanho da amostra. O erro padrão, portanto,é usado para calcular o intervalo de confiança, pois é o erro admitido num intervalo (erro de estimação). Como o intervalo de confiança tem centro na média da amostra, o erro máximo provável que está sendo admitido é igual à metade da amplitude do intervalo. A estatística inferencial envolvida na construção de intervalos de confiança, etambém nos testes de significância são baseadas no erro-padrão. Este, por sua vez, depende do tamanho da amostra (quanto maior o tamanho da amostra, menor o erro-padrão).