Teste t de Duas amostras
A calculadora para realizar o Teste t para a Significância da Diferença entre as Médias de Duas Amostras Independentes
A calculadora abaixo implementa o teste estatístico mais conhecido, chamado Teste t de Amostras Independentes ou o Teste t de Duas Amostras. Teste t, também conhecido como Teste t de Student, em homenagem a William Sealy Gosset. "Student" era seu pseudônimo.
O teste lida com a hipótese nula de que as médias de duas populações são iguais. Em outras palavras, a diferença que encontramos entre as médias das duas amostras não deve diferir significativamente de zero.
Mais uma vez, o teste funciona apenas se certas suposições forem atendidas. São elas:
- Que as duas amostras sejam retiradas de forma independente e aleatória da(s) população(ões) de origem.
- Que a escala de medição para ambas as amostras tenham as propriedades de uma escala de intervalo igual.
- Que se pode razoavelmente supor que a(s) população(ões) de origem possuam uma distribuição normal.
- E, para esta implementação particular do teste, que a variância de cada população seja a mesma.
A calculadora exibe um nível de confiança para testes direcionais e não direcionais. Suponhamos que você obtenha o resultado de 96%. Essencialmente, isso significa que você tem 96% de confiança de que a diferença obtida mostra algo mais do que apenas sorte. A chance de você alcançar a diferença obtida e as médias das duas amostras serem iguais é de apenas 4%. Este é o nível de significância que você calcula. Agora, dependendo do seu nível de significância escolhido, você pode rejeitar, ou não, sua hipótese nula.
Para estimar a confiança, precisamos calcular o valor t e seguidamente consultar o inverso da FDA da distribuição t de Student com graus de liberdade.
é o tamanho da amostra A e
é o tamanho da amostra B.
Para encontrar o valor t, você começa calculando a média e a soma dos desvios quadrados, ou soma dos quadrados
para cada amostra.
Então, você estima a variância da população de origem como
Essa estimativa é nomeada como variância combinada, e é um método para estimar a variância de várias populações diferentes quando a média de cada população pode ser diferente. Ainda assim, pode-se supor que a variância de cada população é igual.
Em seguida, você estima o desvio padrão da distribuição de amostragem das diferenças médias da amostra (o "erro padrão" de ) como
.
Finalmente, você calcula t como
Se você se interessar em saber mais, pode ler explicações excelentes aqui, começando a partir do Capítulo 9.
Comentários