Section : Tests non paramétriques
Précédent : Tests non paramétriques
Suivant : Test de Kolmogorov-Smirnov

Test sur la valeur d'un quantile

Ici, comme dans tout le chapitre, le modèle de base est celui d'un échantillon d'une loi inconnue $ P$. Les $ n$ données sont donc supposées être des réalisations de variables aléatoires indépendantes, de même loi $ P$. Cette loi n'est pas supposée appartenir à une famille paramétrique particulière (d'où le nom de test non paramétrique). Dans un premier temps, l'hypothèse $ {\cal H}_0$ portera sur la valeur d'un quantile de $ P$.

Prenons le cas d'un traitement censé faire baisser le taux de cholestérol. Pour chaque individu $ i$ d'un groupe de patients, la différence $ X_i$ entre le taux après et avant traitement est mesurée. Certaines de ces différences sont négatives (diminutions), d'autres positives (augmentations). L'hypothèse $ {\cal H}_0$ est que le traitement n'a pas d'effet significatif. On rejettera $ {\cal H}_0$ (on décidera que le traitement est efficace) si suffisamment de baisses ont été observées. La statistique de test est le nombre de baisses :

$\displaystyle T= \sum_{i=1}^n$   1$\displaystyle _{(-\infty,0]}(X_i)\;.
$

(La notation 1$ _A(x)$ désigne la fonction indicatrice de l'ensemble $ A$, qui vaut 1 si $ x\in A$ et 0 sinon.) Si $ {\cal H}_0$ est vraie, la médiane de la loi $ P$ des $ X_i$ est nulle et $ T$ suit la loi binomiale $ {\cal B}(n,0.5)$.

Nous généralisons la situation à la valeur d'un quantile quelconque.

Proposition 2.1   Soit $ (X_1,\ldots,X_n)$ un échantillon de la loi $ P$, de fonction quantile $ Q$. Soit $ u\in ]0,1[$ un réel fixé. Considérons l'hypothèse nulle :

$\displaystyle {\cal H}_0\;:\; Q(u)=q_0\;,
$

$ q_0$ est un réel fixé. Soit $ T$ le nombre d'éléments de l'échantillon inférieurs à $ q_0$ :

$\displaystyle T= \sum_{i=1}^n$   1$\displaystyle _{(-\infty,q_0]}(X_i)\;.
$

Sous l'hypothèse $ {\cal H}_0$, $ T$ suit la loi binomiale $ {\cal B}(n,u)$.

Le cas particulier où $ u=$0.5 et $ q_0=$0, présenté en exemple ci-dessus, porte le nom de test des signes . Supposons que sur 46 individus on ait observé 29 baisses du taux de cholestérol. La p-valeur correspondante est :

$\displaystyle p(29) = 1-F_{{\cal B}(46,0.5)}(28) = 0.0519\;.
$

Pour un échantillon de grande taille, on peut remplacer la loi binomiale par son approximation normale. Sous $ {\cal H}_0$, la statistique centrée réduite :

$\displaystyle T' = \frac{T-nu}{\sqrt{nu(1\!-\!u)}}\;,
$

suit approximativement la loi normale $ {\cal N}(0,1)$. Dans l'exemple ci-dessus, $ T'$ prend la valeur 1.7693. La p-valeur correspondante est :

$\displaystyle 1-F_{{\cal N}(0,1)}(1.7693) = 0.0384\;.
$

Il est conseillé de limiter l'usage des approximations normales aux seuls cas où la loi exacte n'est pas calculable.



Section : Tests non paramétriques
Précédent : Tests non paramétriques
Suivant : Test de Kolmogorov-Smirnov