Ici, comme dans tout le chapitre, le modèle de base est celui d'un échantillon d'une loi inconnue . Les données sont donc supposées être des réalisations de variables aléatoires indépendantes, de même loi . Cette loi n'est pas supposée appartenir à une famille paramétrique particulière (d'où le nom de test non paramétrique). Dans un premier temps, l'hypothèse portera sur la valeur d'un quantile de .
Prenons le cas d'un traitement censé faire baisser le taux de cholestérol. Pour chaque individu d'un groupe de patients, la différence entre le taux après et avant traitement est mesurée. Certaines de ces différences sont négatives (diminutions), d'autres positives (augmentations). L'hypothèse est que le traitement n'a pas d'effet significatif. On rejettera (on décidera que le traitement est efficace) si suffisamment de baisses ont été observées. La statistique de test est le nombre de baisses :
(La notation 1 désigne la fonction indicatrice de l'ensemble , qui vaut 1 si et 0 sinon.) Si est vraie, la médiane de la loi des est nulle et suit la loi binomiale .
Nous généralisons la situation à la valeur d'un quantile quelconque.
où est un réel fixé. Soit le nombre d'éléments de l'échantillon inférieurs à :
Sous l'hypothèse , suit la loi binomiale .
Pour un échantillon de grande taille, on peut remplacer la loi binomiale par son approximation normale. Sous , la statistique centrée réduite :
suit approximativement la loi normale . Dans l'exemple ci-dessus, prend la valeur 1.7693. La p-valeur correspondante est :