La fonction quantile d'une variable aléatoire (ou d'une loi de probabilité) est l'inverse de sa fonction de répartition. Quand cette fonction de répartition est strictement croissante, son inverse est définie sans ambigüité. Mais une fonction de répartition reste constante sur tout intervalle dans lequel la variable aléatoire ne peut pas prendre de valeurs. C'est pourquoi on introduit la définition suivante.
Par convention, on peut décider que est la plus petite des valeurs possibles pour et est la plus grande (elles sont éventuellement infinies).
Lois discrètes. La fonction quantile d'une variable aléatoire discrète est une fonction en escalier, comme la fonction de répartition. Si prend les valeurs , rangées par ordre croissant, la fonction de répartition est égale à :
Lois continues. Plaçons-nous dans le cas le plus fréquent, où la densité est strictement positive sur un intervalle de (son support) et nulle ailleurs. Si l'intervalle est , la fonction de répartition est nulle avant si est fini, elle est strictement croissante de 0 à 1 entre et , elle vaut 1 après si est fini. Toute valeur strictement comprise entre 0 et 1 est prise une fois et une seule par . La valeur de est le point unique, compris entre et , tel que .
Calculons par exemple la fonction quantile de la loi exponentielle , de fonction de répartition 1. Pour tout ,
La fonction quantile est un moyen de décrire la dispersion d'une loi. Si on réalise un grand nombre de tirages indépendants de la même loi (un échantillon), on doit s'attendre à ce qu'une proportion des valeurs soient inférieures à . Une valeur importante est la médiane , . Les fonctions quantiles sont souvent utilisées en statistiques. On calcule en particulier fréquemment des intervalles de dispersion, compris comme devant contenir une forte proportion des données.
En statistiques, les réels compris entre 0 et 1 sont de tradition. La même tradition leur affecte prioritairement les valeurs et , plus rarement , ou . Il faut donc lire comme "une faible proportion", et comme "une forte proportion". Un intervalle de dispersion de niveau pour est tel que appartient à cet intervalle avec probabilité , il contient donc une forte proportion de la densité, même s'il est en général beaucoup plus petit que le support de la loi. Il existe en général une infinité d' intervalles de dispersion de niveau donné. En voici quelques uns, de niveau pour la loi normale .
Selon les valeurs de , on dit qu'un intervalle de dispersion de niveau est :
Une autre application importante de la fonction quantile est la méthode d'inversion qui est une méthode générale, consistant à simuler une variable aléatoire de loi quelconque, en composant un appel de Random avec sa fonction quantile.
Démonstration : Pour tout , on a :
Exemple : La fonction quantile de la loi exponentielle associe à la valeur
Random
(Il est inutile de calculer Random car Random et Random suivent la même loi).
La méthode d'inversion n'est exacte qu'à condition de connaître l'expression explicite de , comme pour la loi exponentielle. C'est rarement le cas. Si on veut appliquer la méthode à la loi normale par exemple, il faudra utiliser un algorithme d'approximation. En plus de l'imprécision, la méthode d'inversion sera alors relativement lente. Même quand on connaît explicitement , la méthode d'inversion est rarement la plus efficace pour les variables à densité. Elle convient par contre bien à de nombreuses loi discrètes.
Supposons que prenne les valeurs , rangées par ordre croissant. Notons la valeur de la fonction de répartition sur l'intervalle . L'algorithme de simulation par inversion est le suivant.
Random
TantQue () faire
finTantQue
Modifions légèrement cet l'algorithme en lui rajoutant une interpolation linéaire. Quand tombe dans l'intervalle , au lieu de retourner comme précédemment, nous retournons :
Ceci revient à remplacer la fonction de répartition en escalier par une fonction de répartition linéaire par morceaux, passant par les points . La distribution de probabilité correspondante admet pour densité une fonction en escalier (constante sur les intervalles ). C'est un histogramme.