Teste U de Mann-Whitney

Esta calculadora online executa o teste U de Mann–Whitney (também chamado de Mann–Whitney–Wilcoxon (MWW), teste de soma dos postos de Wilcoxon ou teste de Wilcoxon–Mann–Whitney).

Como foi determinado em Teste t de duas amostras, você pode aplicar o teste t se as seguintes suposições forem atendidas:

  • As duas amostras sejam retiradas de forma independente e aleatória da(s) população(ões) de origem.
  • A escala de medição para ambas as amostras tenha as propriedades de uma escala de intervalo igual.
  • Pode-se razoavelmente supor que a(s) população(ões) de origem possuem uma distribuição normal.

Às vezes, no entanto, seus dados falham em atender o segundo e/ou terceiro requisito. Por exemplo, não há nada que indique que ela tenha uma distribuição normal ou você não tem uma escala de intervalo igual – ou seja, o espaçamento entre os valores adjacentes não pode ser assumido como constante. Mas você ainda deseja descobrir se a diferença entre duas amostras é significativa. Nesses casos, você pode utilizar o teste U de Mann-Whitney, uma alternativa não paramétrica do teste t.

Em estatística, o teste U de Mann-Whitney (também chamado de Mann–Whitney–Wilcoxon (MWW), teste de soma dos postos de Wilcoxon ou teste de Wilcoxon–Mann–Whitney) é um teste não paramétrico da hipótese nula de que é igualmente provável que um valor selecionado aleatoriamente de uma amostra seja menor ou maior que um valor selecionado aleatoriamente de uma segunda amostra1, ou p(X<Y)=0.5. Entretanto, também é usado como um substituto para o teste t de grupos independentes, com a hipótese nula de que as duas medianas da população são iguais.

A propósito, existem realmente dois testes - o teste U de Mann-Whitney e o teste de soma dos postos de Wilcoxon. Eles foram desenvolvidos de forma independente e usam medidas diferentes, mas são estatisticamente equivalentes.

As suposições do teste de Mann-Whitney são:

  • Que as duas amostras sejam retiradas de forma aleatória e independente;
  • Que a variável dependente é intrinsecamente contínua - capaz em princípio, senão na prática, de produzir medidas executadas com a enésima casa decimal;
  • Que as medidas dentro das duas amostras têm as propriedades de no mínimo uma escala ordinal de medição, para que seja significativo falar de "maior que", "menor que" e "igual a".2

Como você pode ver, este teste não paramétrico não assume (ou requer) amostras de populações normalmente distribuídas. Esses testes também são chamados de testes livres de distribuição.

Palavra de cautela

Já se sabe há algum tempo que o teste de Wilcoxon-Mann-Whitney é afetado de maneira adversa pela heterogeneidade da variância quando os tamanhos das amostras não são iguais. Entretanto, mesmo quando os tamanhos das amostras são iguais, diferenças muito pequenas entre as variâncias da população fazem com que o teste de Wilcoxon-Mann-Whitney para amostras grandes se torne muito liberal, ou seja, a taxa de erro Tipo I real para amostras grandes do teste de Wilcoxon-Mann-Whitney aumentou na medida em que o tamanho da amostra aumentou.3.

Portanto, você deve se lembrar que este teste é verdadeiro apenas se as duas distribuições da população são as iguais (incluindo homogeneidade de variância), exceto por uma mudança na localização.

O método

O método substitui os valores brutos por suas classificações correspondentes. Com isso, alguns resultados podem ser alcançados usando matemática básica. Por exemplo, a soma total das posições já é conhecida a partir do tamanho total e é \frac{N*(N+1)}{2}. Sendo assim, a classificação média é \frac{N*(N+1)}{2}*\frac{1}{N}=\frac{N+1}{2}.

Em termos gerais, se a hipótese nula for verdadeira e as amostras não forem significativamente diferentes, então as classificações são um tanto equilibradas entre A e B, e a classificação média para cada amostra deve se aproximar da classificação média total e as somas das classificações devem se aproximar de \frac{n_A*(N+1)}{2} e \frac{n_B*(N+1)}{2} respectivamente.

O cálculo

Para executar o teste, primeiramente você precisa calcular uma medida conhecida como U para cada amostra.

Você começa combinando todos os valores de ambas as amostras em um único conjunto, classificando-os por valor e os atribuindo uma classificação a cada valor (em caso de empate, cada valor recebe uma classificação média). As classificações vão de 1 a N, onde N é a soma dos tamanhos n_A e n_B. Seguidamente, você calcula a soma das classificações para os valores de cada amostra R_A e R_B.

Agora você pode calcular U como
U_A=n_A*n_B+\frac{n_A*(n_A+1)}{2}-R_A\\U_B=n_A*n_B+\frac{n_B*(n_B+1)}{2}-R_B

Para tamanhos de amostra pequenos, você pode usar valores tabulados. Você pega o mínimo de dois Us e, em seguida, o compara com o valor crítico correspondente aos tamanhos da amostra e ao nível de significância escolhido. Livros de estatística geralmente listam valores críticos em tabelas para tamanhos de amostra até 20.

Para tamanhos de amostra grandes, você pode usar o teste z. Foi mostrado que U é aproximadamente normalmente distribuído se ambos os tamanhos de amostra forem iguais ou maiores que 5 (algumas fontes dizem que n_A*n_B>204).

z=\frac{U-\mu_U}{\sigma_U},
onde
\mu_U=\frac{n_A*n_B}{2}\\ \sigma_U=\sqrt{\frac{n_A*n_B*(N+1)}{12}}

Em caso de empate, a fórmula para o desvio padrão passa a ser
\sigma_U=\sqrt{\frac{n_A*n_B}{N*(N-1)}*[\frac{N^3-N}{12}-\sum_{j=1}^g\frac{t_{j}^3-t_j}{12}]}
onde g é o número de grupos de empates, tj é o número de classificações empatadas no grupo j.

A calculadora abaixo usa o teste z. Obviamente, há uma limitação nos tamanhos de amostra (ambos os tamanhos de amostra devem ser iguais ou maiores que 5), mas isso provavelmente não é uma limitação para casos reais.

PLANETCALC, Teste U de Mann-Whitney

Teste U de Mann-Whitney

Dígitos após o ponto decimal: 2
O arquivo é muito grande; pode ocorrer lentidão do navegador durante o carregamento e a criação.
U para a amostra A
 
U para a amostra B
 
Significado U
 
Desvio padrão U
 
Pontuação Z (valor absoluto)
 
Nível de confiança para hipótese não direcional
 
Nível de confiança para hipótese direcional
 

URL copiado para a área de transferência
PLANETCALC, Teste U de Mann-Whitney

Comentários