Risques et puissance

Section : Hypothèses alternatives
Précédent : Hypothèses alternatives
Suivant : Tests paramétriques

Risques et puissance

Jusqu'ici nous n'avons testé qu'une seule hypothèse de modélisation ${\cal H}_0$ . La seule erreur qui pouvait être quantifiée consistait à rejeter ${\cal H}_0$ à tort. La probabilité de cette erreur est le seuil $\alpha$ du test. Ne pas rejeter ${\cal H}_0$ signifie seulement que rien ne s'est produit qui permette de la mettre en doute. Cela ne signifie pas que ${\cal H}_0$ soit ``vraie'' (les lois de probabilité n'existent pas dans la nature). Nous allons nous placer désormais dans une situation où deux modèles sont en compétition. Les données disponibles devront nous permettre de prendre une décision sur ${\cal H}_0$ , par référence à une autre hypothèse ${\cal H}_1$ . On dit alors qu'on teste ${\cal H}_0$ contre ${\cal H}_1$ .

Prenons l'exemple d'un indicateur physiologique (taux d'une certaine substance dans le sang) dont une valeur élevée est un symptôme d'une certaine maladie. Comme d'habitude, on considèrera que le taux observé sur un individu est la réalisation d'une certaine variable aléatoire. Supposons que des études antérieures aient montré que chez un sujet sain, la valeur de suit la loi ${\cal N}(1,0.09)$ , alors que chez un sujet malade, elle suit la loi ${\cal N}(2,0.16)$ . Si la maladie est peu grave, et que le traitement comporte des risques pour le patient, le médecin choisira de privilégier l'hypothèse que son patient est en bonne santé : ce sera son hypothèse nulle ${\cal H}_0$ . Elle sera testée par un test unilatéral à droite (rejet des valeurs de trop grandes). Au seuil $\alpha=0.05$ , la règle de décision est :

Rejet de $\displaystyle {\cal H}_0\;\Longleftrightarrow\; T> l_0 = Q_{{\cal N}(1,0.09)}(0.95) = 1.493\;.$

On décidera donc que le patient est malade si son taux est supérieur à . Le seuil $\alpha$ mesure le risque de rejeter ${\cal H}_0$ à tort (déclarer malade un individu sain). Mais un autre risque consiste à ne pas rejeter ${\cal H}_0$ alors que ${\cal H}_1$ est vraie (ne pas diagnostiquer la maladie alors que le patient est effectivement atteint). On note $\beta$ la probabilité correspondante :

$\displaystyle \beta = \mathbb{P}_{{\cal H}_1}[\,$ Ne pas rejeter $\displaystyle {\cal H}_0\,]\;.$

Ici la loi de sous l' hypothèse ${\cal H}_1$ est la loi normale ${\cal N}(2,0.16)$ et donc :

$\displaystyle \beta = F_{{\cal N}(2,0.16)}(l_0) = 0.1027\;.$

Rejeter ${\cal H}_0$ à tort est l'erreur de première espèce et le seuil $\alpha$ est le risque de première espèce. Ne pas rejeter ${\cal H}_0$ à tort est l'erreur de deuxième espèce et la probabilité $\beta$ de cette erreur est le risque de deuxième espèce. La probabilité $1\!-\!\beta$ de rejeter ${\cal H}_0$ sous ${\cal H}_1$ s'appelle la puissance du test.

Comme nous l'avons montré en exemple, il se peut que le risque de deuxième espèce $\beta$ soit assez important, alors que le seuil $\alpha$ est fixé en définissant le test. L'erreur de première espèce est celle qu'on choisit de maîtriser, quitte à ignorer le risque de deuxième espèce. Cela induit une dissymétrie dans le traitement des deux hypothèses. La règle de rejet du test est définie uniquement à partir de $\alpha$ et ${\cal H}_0$ . Entre deux alternatives, on choisira pour ${\cal H}_0$ l'hypothèse qu'il serait le plus grave de rejeter à tort.

Reprenons l'exemple du diagnostic mais supposons maintenant que la maladie est potentiellement très grave, mais facilement soignable. Le danger serait de ne pas la détecter. Le médecin choisira comme hypothèse nulle l'hypothèse que le patient est atteint.

$\displaystyle {\cal H}'_0\;:\; T$ suit la loi $\displaystyle {\cal N}(2,0.16)\;.$

Le test sera cette fois unilatéral à gauche (rejet des valeurs trop faibles). Au seuil $\alpha=$ 0.05, la règle de décision est :

Rejet de $\displaystyle {\cal H}'_0\;\Longleftrightarrow\; T< l_1 = Q_{{\cal N}(2,0.16)}(0.05) = 1.342\;.$

On constate que est inférieur à . Ce test est donc différent du précédent. Selon la valeur de , les décisions peuvent coïncider ou non.

$\bullet$: Si : acceptation de ${\cal H}_0$ et rejet de ${\cal H}'_0$ , les décisions sont cohérentes.
$\bullet$: Si : acceptation de ${\cal H}_0$ et de ${\cal H}'_0$ , résultat non interprétable.
$\bullet$: Si : rejet de ${\cal H}_0$ et acceptation de ${\cal H}'_0$ , les décisions sont cohérentes.

Section : Hypothèses alternatives
Précédent : Hypothèses alternatives
Suivant : Tests paramétriques