Section : Statistiques de test
Précédent : Modèles probabilistes réfutables
Suivant : Seuil et p-valeur

Règles de décision

Un modèle probabiliste a donc été choisi, qui fait des données observées des réalisations de variables aléatoires. Notons $ (x_1,\ldots,x_n)$ les données et $ (X_1,\ldots,X_n)$ les variables aléatoires qui les modélisent. Sur la loi de ces variables aléatoires, un certain nombre d'hypothèses sont émises et ne seront pas remises en cause. Une hypothèse particulière, $ {\cal H}_0$ doit être testée. La décision va porter sur la valeur prise par une certaine fonction $ \tau$ des données :

$\displaystyle T=\tau(X_1,\ldots,X_n)\;.
$

Dans le modèle, $ T$ est une variable aléatoire, la statistique de test . Elle est choisie de sorte que sa loi de probabilité sous l'hypothèse $ {\cal H}_0$ est connue. Nous notons cette loi $ P_0$. Si les $ x_i$ sont des réalisations des $ X_i$, alors $ t=\tau(x_1,\ldots,x_n)$ est la valeur prise par $ T$. Le test consiste à rejeter l'hypothèse $ {\cal H}_0$ quand la valeur $ t$ est trop peu vraisemblable pour $ P_0$.

Pour la loi de probabilité $ P_0$, les valeurs les plus plausibles sont contenues dans ses intervalles de dispersion . Ils s'expriment à l'aide de la fonction quantile. Si $ T$ est une variable aléatoire, la fonction quantile de la loi de $ T$ est la fonction de [0,1] dans $ \mathbb{R}$ qui à $ u\in $[0,1] associe :

$\displaystyle Q_T(u) = \inf\{t$ t.q. $\displaystyle \mathbb{P}[T\leq t]\geq u\}\;.
$

C'est l'inverse de la fonction de répartition. Les fonctions quantile, comme les fonctions de répartition. de toutes les lois usuelles sont disponibles dans les environnements de calcul courants.

Définition 1.3   Soit $ T$ une variable aléatoire $ \alpha$ un réel compris entre 0 et 1. On appelle intervalle de dispersion de niveau $ 1\!-\!\alpha$ tout intervalle de la forme :

$\displaystyle [\,Q_T(\alpha')\,,\,Q_T(1-\alpha+\alpha')\,]\;,$   avec $\displaystyle 0\leq \alpha'\leq \alpha\;.
$

Un intervalle de dispersion de niveau $ 1\!-\!\alpha$ pour $ T$ est tel que $ T$ appartient à cet intervalle avec probabilité $ 1\!-\!\alpha$. Il contient donc une forte proportion des valeurs que prendra $ T$, même s'il est en général beaucoup plus petit que le support de la loi.

Selon les valeurs de $ \alpha'$, on dit qu'un intervalle de dispersion de niveau $ 1\!-\!\alpha$ est :

$ \bullet$
unilatéral inférieur si $ \alpha'=0$,
$ \bullet$
unilatéral supérieur si $ \alpha'=\alpha$,
$ \bullet$
symétrique si $ \alpha'=\alpha/2$,
$ \bullet$
optimal si son amplitude est la plus courte parmi tous les intervalles de dispersion de niveau $ 1\!-\!\alpha$.
Voici les intervalles de dispersion unilatéraux et symétriques, de niveaux 0.95 et 0.99 pour la loi normale $ {\cal N}(0,1)$.

\begin{displaymath}
\begin{array}{\vert c\vert c\vert c\vert c\vert}
\hline
\alp...
...758&2.5758\\
0.01&0.01&-2.3263&+\infty\\
\hline
\end{array}\end{displaymath}

Quand la loi de la variable aléatoire $ T$ est discrète, la notion d'intervalle de dispersion recèle une certaine ambiguïté. Considérons par exemple la loi binomiale $ {\cal B}(10,0.6)$. Voici les valeurs de sa fonction de répartition.

$ i$
0
1
2
3
4
5
6
7
8
9
10
$ F(i)$
0.000
0.002
0.012
0.055
0.166
0.367
0.618
0.833
0.954
0.994
1

Fixons $ 1\!-\!\alpha=$0.9. En toute rigueur, la valeur de la fonction quantile, au point 0.9 est 7. L'intervalle [0,7] devrait donc être un intervalle de dispersion de niveau 0.9 pour la loi $ {\cal B}(10,0.6)$. Pourtant sa probabilité n'est que de 0.833. Pour les calculs utilisant les intervalles de dispersion, on applique toujours un principe de précaution, qui consiste à garantir le niveau. On ne qualifiera donc d'intervalle de dispersion de niveau $ 1\!-\!\alpha$ que les intervalles dont la probabilité est supérieure ou égale à $ 1\!-\!\alpha$. Ce principe amène à modifier la définition 1.3 pour les lois discrètes à valeurs dans $ \mathbb{N}$, en remplaçant la borne de droite $ Q_T(1-\alpha+\alpha')$ par $ 1+Q_T(1-\alpha+\alpha')$. Le tableau ci-dessous donne la liste des intervalles de dispersion de niveau $ \geq$ 0.9, avec leur probabilité exacte, pour la loi $ {\cal B}(10,0.6)$.

Intervalle
[0,8]
[1,8]
[2,8]
[3,8]
[4,9]
[4,10]
Probabilité
0.954
0.954
0.952
0.941
0.939
0.945

Deux intervalles sont d'amplitude minimale, [3,8] et [4,9]. On choisira celui dont la probabilité est la plus proche du niveau prescrit, à savoir [4,9].


Un test consistera à rejeter l'hypothèse $ {\cal H}_0$ si la valeur prise par la statistique de test est en dehors d'un intervalle de dispersion de niveau donné.

Proposition 1.4   Soit $ {\cal H}_0$ une hypothèse et $ \alpha$ un réel compris entre 0 et 1 . On définit un test de seuil $ \alpha$ pour $ {\cal H}_0$ par la règle de décision :

   Rejet de $\displaystyle {\cal H}_0\;\Longleftrightarrow\;
T\notin I_\alpha\;,
$

$ \bullet$
$ T$ est une statistique de test,
$ \bullet$
$ I_\alpha$ est un intervalle de dispersion de niveau $ 1\!-\!\alpha$ pour la loi de $ T$ sous $ {\cal H}_0$.

Le complémentaire de $ I_\alpha$ s'appelle la région de rejet. Si $ {\cal H}_0$ est vraie, le seuil $ \alpha$ est la probabilité que la valeur prise par $ T$ soit en dehors de $ I_\alpha$, et donc que $ {\cal H}_0$ soit rejetée à tort.

$\displaystyle \mathbb{P}_{{\cal H}_0}[\,$Rejet de $\displaystyle {\cal H}_0\,] = \alpha\;.
$

Nous avons laissé jusqu'ici une grande latitude quant au choix de l'intervalle de dispersion. Les intervalles les plus utilisés sont symétriques ou unilatéraux.

Définition 1.5   On dit qu'un test est :
$ \bullet$
unilatéral si la région de rejet est le complémentaire d'un intervalle de dispersion unilatéral.
$ \bullet$
bilatéral si la région de rejet est le complémentaire d'un intervalle de dispersion symétrique.

Dans le cas de l'efficacité d'un médicament, avec le nombre de guérisons comme statistique de test, on choisira un test unilatéral (le traitement est inefficace si la fréquence de guérison est trop faible, efficace si elle est suffisamment grande). Pour tester un générateur pseudo-aléaoire, avec le nombre d'appels entre 0.4 et 0.9 comme statistique de test, on rejettera aussi bien les valeurs trop grandes que trop petites, et le sera bilatéral.

Nous résumons dans la définition suivante les trois types de tests usuels.

Définition 1.6   Soit $ {\cal H}_0$ l'hypothèse nulle, $ \alpha$ le seuil, $ T$ la statistique de test et $ Q_0$ sa fonction quantile sous l'hypothèse $ {\cal H}_0$.
  1. Le test bilatéral (rejet des valeurs trop écartées) est défini par la règle de décision :

       Rejet de $\displaystyle {\cal H}_0\,\Longleftrightarrow\;
T\notin [Q_0(\alpha/2)\,,\,Q_0(1\!-\!\alpha/2)]\;.
$

  2. Le test unilatéral à droite (rejet des valeurs trop grandes) est défini par la règle de décision :

       Rejet de $\displaystyle {\cal H}_0\,\Longleftrightarrow\;
T > Q_0(1\!-\!\alpha)\;.
$

  3. Le test unilatéral à gauche (rejet des valeurs trop petites) est défini par la règle de décision :

       Rejet de $\displaystyle {\cal H}_0\,\Longleftrightarrow\;
T < Q_0(\alpha)\;.
$

Supposons que la statistique de test $ T$ suive sous $ {\cal H}_0$ la loi binomiale $ {\cal B}(100,0.5)$, comme dans l'exemple du générateur pseudo-aléatoire. L'intervalle de dispersion symétrique de niveau $ \alpha=$0.05 est [40,60]. Le test bilatéral de seuil 0.05 consistera à rejeter $ {\cal H}_0$ si la statistique de test prend une valeur inférieure à 40 ou supérieure à 60. Pour la loi binomiale, comme pour d'autres, on peut choisir d'utiliser l'approximation normale : si $ n$ est assez grand, la loi $ {\cal B}(n,p)$ est proche de la loi normale de même espérance et de même variance. Ici, la loi de $ T$ est proche de la loi $ {\cal N}(50,25)$. L'intervalle de dispersion symétrique de niveau 0.95 pour cette loi est [40.2,59.8]. D'après cet intervalle, on devrait aussi rejeter les valeurs 40 et 60. Ce genre d'approximation était d'usage courant quand on ne disposait que de tables de quantiles. Les environnements de calcul sont désormais capables d'effectuer des calculs précis de n'importe quel quantile pour toutes les lois usuelles. En règle générale, il faut éviter d'utiliser un résultat d'approximation quand un calcul exact est possible.

Les quantiles de la loi $ {\cal N}(50,25)$ n'ont jamais été tabulés. Pour les calculer, on se ramenait à la loi $ {\cal N}(0,1)$, en remplaçant la statistique de test $ T$ par sa valeur centrée réduite.

$\displaystyle T'=\frac{T-50}{\sqrt{25}}\;.
$

Si on admet que la variable $ T'$ suit la loi $ {\cal N}(0,1)$, le test bilatéral de seuil 0.05 consiste à rejeter toute valeur à l'extérieur de l'intervalle de dispersion [-1.96,+1.96]. C'est évidemment équivalent au fait de rejeter les valeurs de $ T$ à l'extérieur de l'intervalle [40.2,59.8]. D'autres transformations sont possibles. Si $ T'$ suit la loi $ {\cal N}(0,1)$, alors $ T''=(T')^2$ suit la loi du chi-deux $ {\cal X}^2(1)$. Rejeter les valeurs de $ T'$ à l'extérieur de l'intervalle [-1.96,+1.96] est équivalent à rejeter les valeurs de $ T''$ supérieures à $ (1.96)^2=3.841$, qui est effectivement le quantile d'ordre 0.95 de la loi $ {\cal X}^2(1)$. Remarquons qu'un test bilatéral sur la statistique $ T'$ est équivalent à un test unilatéral à droite sur la statistique $ T''$.


Les chapitres 2 et 3 contiennent les exemples les plus classiques de tests, d'abord sur les quantiles, ensuite dans le cadre gaussien. Nous ne préciserons pas toujours s'il s'agit de tests bilatéraux ou unilatéraux. L'important est de décrire l'hypothèse $ {\cal H}_0$, la statistique de test $ T$ et sa loi sous $ {\cal H}_0$. Décider si le test doit être unilatéral à gauche ou à droite ou bien bilatéral est le plus souvent affaire de bon sens.



Section : Statistiques de test
Précédent : Modèles probabilistes réfutables
Suivant : Seuil et p-valeur