La construction des intervalles de confiance nécessite de connaître la loi des estimateurs à partir desquels ils sont construits. En dehors du cas des échantillons gaussiens, ce n'est pas toujours possible. De plus, il est fréquent que les calculs de lois, effectivement implémentables pour de petits échantillons, deviennent infaisables pour un échantillon de grande taille. On cherche alors à remplacer la loi de l'estimateur par une approximation plus simple, permettant de construire des intervalles de confiance dont le niveau n'est garanti que asymptotiquement.
Le plus souvent, cette notion est utilisée quand on dispose d'un estimateur
convergent de dont la loi est
asymptotiquement normale,
ce qui
est en général une conséquence du
théorème central limite.
Nous traitons tout d'abord le cas de l'estimation de l'espérance.
Les utilisations de la
normalité asymptotique
vont bien au-delà de
l'estimation
des
moyennes.
A titre d'exemple, nous traitons ci-dessous
l'estimation
des
quantiles
d'une
loi continue.
Considérons un
échantillon
d'une
loi continue.
Nous noterons
sa
densité,
sa
fonction de répartition
et
sa
fonction quantile.
Etant donnée une valeur
, le problème consiste à estimer
(par exemple,
si
,
est la médiane). A
l'échantillon
est
associée une
fonction quantile empirique.
Sa valeur en
est la
-ième
statistique d'ordre
, où
est l'entier tel que
. Nous noterons
cette
variable aléatoire.
C'est un
estimateur convergent
de
. On peut
écrire explicitement sa
densité
en
fonction de
et
:
Cependant, il n'y a pas en général d'expression explicite pour la
fonction de répartition
ni pour la
fonction quantile
de , et le calcul
numérique des
intervalles de dispersion
peut être assez problématique
pour de grandes valeurs de
. On démontre que la loi de
est
asymptotiquement normale.
La loi de converge vers la
loi normale
.
En pratique, la taille de
l'échantillon,
même grande, est toujours fixée.
Dans l'utilisation de la
normalité asymptotique,
la question se pose
évidemment de la qualité de l'approximation normale à fixé.
A partir de quelle valeur de
est-il légitime de remplacer une loi
exacte par son approximation normale pour un calcul d'intervalle de
confiance ? Il est impossible de donner des bornes valables dans toutes les
situations. A titre d'exemple, nous considèrerons trois familles de
lois asymptotiquement normales, les lois
binomiales,
les
lois de Poisson
et les lois
lois gamma
(incluant les
lois du chi-deux
comme cas particulier).
La loi
, la loi
et la loi
sont proches de la
loi normale
de même
espérance
et de même
variance,
quand
est grand.
Le tableau ci-dessous donne les
distances de Kolmogorov-Smirnov
entre
quelques unes de ces lois et leurs approximations normales (la
distance de Kolmogorov-Smirnov
est la différence maximale en
valeur absolue entre fonctions de répartition).
Les environnements de calcul sont désormais capables d'effectuer des calculs précis de n'importe quel quantile pour toutes les lois usuelles. En règle générale, il faut éviter d'utiliser la normalité asymptotique quand un calcul exact est possible.