Section : Tests non paramétriques
Précédent : Test du rapport de cotes
Suivant : Tests sur des échantillons gaussiens

Tests de Wilcoxon et Mann-Whitney

Reprenons encore le problème de tester l'effet d'un traitement sur un caractère donné (le taux de cholestérol par exemple). Un groupe témoin sans traitement correspond à un premier échantillon $ (X_1,\ldots,X_{n_x})$ de la loi $ P_x$. Sur un deuxième groupe, avec traitement, les valeurs mesurées sont celles de l'échantillon $ (Y_1,\ldots,Y_{n_y})$ de la loi $ P_y$. Les deux lois $ P_x$ et $ P_y$ sont inconnues. Si le traitement n'a aucun effet (hypothèse nulle), les deux lois sont identiques.

$\displaystyle {\cal H}_0\;:\; P_x=P_y\;.
$

L'idée du test de Wilcoxon est la suivante : si on rassemble les deux échantillons, et que l'on range les valeurs dans l'ordre, l'alternance des $ X_i$ et des $ Y_j$ devrait être assez régulière. On aura des doutes sur $ {\cal H}_0$ si les $ Y_j$ sont plutôt plus grands que les $ X_i$, ou plus petits, ou plus fréquents dans une certaine plage de valeurs. On commence donc par écrire les statistiques d'ordre de l'échantillon global (s'il y a des ex-æquo, on tire au hasard une permutation). On obtient ainsi une suite mélangée des $ X_i$ et des $ Y_j$. On calcule ensuite la somme des rangs des $ X_i$, notée $ W_x$ (c'est la statistique de Wilcoxon ). Sous l'hypothèse $ {\cal H}_0$, la loi de $ W_x$ se calcule facilement : sur un échantillon de taille $ n_x+n_y$, il y a $ (n_x+n_y)!$ ordres possibles. Le nombre de rangements possibles des $ X_i$ est $ \binom{n_x+n_y}{n_x}$, et ils sont équiprobables. On a donc pour tout $ m$ entier allant de $ \binom{n_x}{2}$ à $ \binom{n_x+n_y}{2}-\binom{n_y}{2}$ :

$\displaystyle \mathbb{P}_{{\cal H}_0}[\,W_x = m\,] =
\frac{k_m}{\binom{n_x+n_y}{n_x}}\;,
$

$ k_m$ désigne le nombre de $ n_x$-uplets d'entiers $ r_1,\ldots,r_{n_x}$ dont la somme vaut $ m$ et qui sont tels que :

$\displaystyle 1\leq r_1<r_2<\cdots<r_{n_x}\leq n_x+n_y\;.
$

Il est facile de tabuler numériquement la loi de $ W_x$, pour des valeurs raisonnables de $ n_x$ et $ n_y$. Pour les grandes valeurs, on dispose du résultat d'approximation normale suivant :

Théorème 2.8   Sous l'hypothèse $ {\cal H}_0$, la loi de

$\displaystyle \frac{W_x - n_x(n_x+n_y+1)/2}{\sqrt{n_xn_y(n_x+n_y+1)/12}}\;,
$

converge vers la loi normale $ {\cal N}(0,1)$.

Voici par exemple deux échantillons de taille 10.

\begin{displaymath}
\begin{array}{c}
5.7\,,\;3.2\,,\;8.4\,,\;4.1\,,\;6.9\,,\;
5....
...,,\;4.6\,,\;
1.6\,,\;8.5\,,\;7.1\,,\;8.7\,,\;5.7\,.
\end{array}\end{displaymath}

Voici les statistiques d'ordre de l'échantillon de taille 20 regroupé (les valeurs $ X_i$ du premier échantillon sont soulignées).

\begin{displaymath}
\begin{array}{c}
1.6\,,\;\underline{1.7}\,,\;\underline{2.5}...
...7.9\,,\;8.1\,,\;
\underline{8.4}\,,\;8.5\,,\;8.7\,.
\end{array}\end{displaymath}

La statistique $ W_x$ prend la valeur :

$\displaystyle 2+3+4+5+7+9+12+13+15+18 = 88\;.
$

Les valeurs du premier échantillon ont tendance à être plus petites que celles du second. On cherche à savoir si cette tendance est significative, on réalisera donc un test unilatéral à gauche (rejet d'une valeur trop petite de $ W_x$). La p-valeur correspondante est :

$\displaystyle p(88) = 0.1088\;.
$


Le test de Mann-Whitney provient d'une autre approche mais il est équivalent au précédent. Dans l'exemple ci-dessus, nous voulions vérifier que les valeurs du premier échantillon étaient plus souvent plus petites que celles du second. On aurait pu pour cela compter le nombre de couples $ (X_i,Y_j)$ pour lesquels $ X_i>Y_j$ (avec choix aléatoire en cas d'ex-æquo).

$\displaystyle U = \sum_{i=1}^{n_x}\sum_{j=1}^{n_y}$   1$\displaystyle _{X_i>Y_j}\;.
$

On vérifie aisément que les deux statistiques $ U$ et $ W_x$ sont liées par la relation suivante :

$\displaystyle U = W_x - n_x(n_x+1)/2\;.
$

Les deux tests sont donc strictement équivalents. Pour notre exemple, la statistique $ U$ prend la valeur :

$\displaystyle 1+1+1+1+2+3+5+5+6+8 = 33 = 88-45\;.
$



Section : Tests non paramétriques
Précédent : Test du rapport de cotes
Suivant : Tests sur des échantillons gaussiens