Section : Théorèmes limites
Précédent : Théorème central limite


Intervalles de confiance.

L'idée de l'estimation par intervalle de confiance est de définir, autour de la moyenne empirique, un intervalle aléatoire (dépendant des $ n$ expériences) qui contienne $ \mu$ avec une forte probabilité. C'est l'amplitude de cet intervalle qui mesure la précision de l'estimation.

Théorème 4.3   Soit $ (X_n), n\in \mathbb{N}^*$ une suite de variables aléatoires indépendantes de même loi, d'espérance $ \mu$ et variance $ \sigma^2$ finies. Posons :

$\displaystyle \forall n\in \mathbb{N}\;,\quad
\overline X_n = \frac{X_1+\cdots +X_n}{n}$   et$\displaystyle \quad
S_n^2 = \frac{X_1^2+\cdots +X_n^2}{n} - \overline X_n^2
\;.
$

Soit $ \alpha$ un réel $ >0$ (petit). Soit $ z_\alpha$ le réel $ >0$ tel que :

$\displaystyle \int_{-z_\alpha}^{+z_\alpha}\frac{1}{\sqrt{2\pi}}e^{-x^2/2}\,dx
=1-\alpha
\;.
$

Posons

\begin{displaymath}
\begin{array}{cclcccl}
T_1& =& \overline X_n-
\displaystyle...
...aystyle{\frac{z_\alpha \sqrt{S_n^2} }{\sqrt{n}}}\;.
\end{array}\end{displaymath}

Alors  :

$\displaystyle \lim_{n\rightarrow \infty}\,
P[\,\mu\in[T_1,T_2]\,] \;=\;
\lim_{n\rightarrow \infty}
P[\,\mu\in[T'_1,T'_2]\,] \;=\;
1-\alpha \,
\;.
$

On dit que les intervalles aléatoires $ [T_1,T_2]$ et $ [T'_1,T'_2]$ sont des intervalles de confiance pour $ \mu$, de niveau de confiance asymptotique $ 1-\alpha$.


Interprétation La valeur $ \mu$ étant inconnue, il n'y a pas de raison a priori pour que l'écart-type $ \sigma$ soit connu. S'il est inconnu, on l'estime par l'écart-type empirique $ \sqrt{S_n^2}$. C'est la raison pour laquelle nous donnons deux intervalles de confiance. La valeur de $ z_\alpha$ est lue dans une table, ou retournée par un module de calcul numérique. Les valeurs les plus courantes sont les suivantes :

$ \alpha$
0.01
0.02
0.05
$ z_\alpha$
2.5758
2.3263
1.96

Les intervalles $ [T_1,T_2]$ et $ [T'_1,T'_2]$ sont aléatoires. A l'issue de la série de $ n$ expériences, $ T_1$ et $ T_2$ auront pris des valeurs particulières $ t_1$ et $ t_2$. L'encadrement $ \theta\in [t_1,t_2]$ sera alors vrai ou faux. Pour $ \alpha =0.05$, si on répète $ 100$ fois la série de $ n$ expériences pour obtenir $ 100$ intervalles, on peut s'attendre à ce que cinq d'entre eux ne contiennent pas $ \mu$.

Il faut comprendre un intervalle de confiance comme une précision donnée sur la valeur estimée de $ \mu$ :

$\displaystyle \mu =\overline X_n \pm \frac{z_\alpha \sigma }{\sqrt{n}}$   ou$\displaystyle \qquad
\mu =\overline X_n \pm \frac{z_\alpha \sqrt{S_n^2} }{\sqrt{n}}\;.
$

Estimation d'une probabilité.

Supposons que la quantité à estimer soit la probabilité $ p$ d'un évènement. On réalise une suite d'expériences indépendantes, en notant à chaque fois si l'évènement est réalisé (1) ou non (0). La variable aléatoire correspondant à la $ n$-ième expérience est notée $ X_n$. Les $ X_n$ suivent la loi de Bernoulli de paramètre $ p\,$.

$\displaystyle P[X_n=0]=1\!-\!p\;,\quad
P[X_n=1]=p
\;.
$

$\displaystyle \mu =\mathbb{E}[X_n]=p$   et$\displaystyle \qquad
\sigma^2 =Var[X_n]=p(1\!-\!p)\;.
$

La somme $ X_1+\cdots +X_n$ (nombre de réalisations de l'évènement sur $ n$ expériences) suit la loi binomiale $ {\cal B}(n,p)$. La moyenne empirique $ \overline X_n$ de l'échantillon est ici la fréquence expérimentale de l'évènement. La variance empirique $ S_n^2$ est égale à $ \overline X_n(1-\overline X_n)$. Il est à remarquer ici que la variance et la variance empirique sont majorées par $ 1/4$.

Reprenons l'expérience de l'aiguille de Buffon, consistant à lancer au hasard une aiguille sur un parquet. Si la largeur des lames est égale à la longueur de l'aiguille, nous avons vu que la probabilité (théorique) pour que l'aiguille tombe à cheval sur 2 lames de parquet est $ 2/\pi$. Supposons que l'on répète $ n$ fois l'expérience, physique ou par simulation. A l'issue des $ n$ répétitions, on obtient une valeur de la fréquence expérimentale $ \overline X_n$ et donc un intervalle de confiance $ [T_1,T_2]$. L'intervalle $ [2/T_2,2/T_1]$ est aussi un intervalle de confiance pour la valeur $ \pi$. Voici par exemple des résultats obtenus sur $ n=10^6$ expériences.

$\displaystyle \overline X_n=0.636438\;,\;
\frac{2}{\overline X_n}=3.14249\;.
$

Pour $ 1-\alpha=0.99$ ( $ z_\alpha=2.5758$) et $ 1-\alpha=0.95$ ( $ z_\alpha=1.96$), les intervalles de confiance pour la probabilité sont respectivement :

$\displaystyle [0.6352\,;\,0.6377]\;$ et $\displaystyle \;[0.6355\,;\,0.6374]\;.
$

Ils correspondent aux encadrements suivants pour la valeur de $ \pi$ :

$\displaystyle [3.1364\,;\, 3.1486]\;$ et $\displaystyle \;[3.1378\,;\, 3.14715]\;.
$



Section : Théorèmes limites
Précédent : Théorème central limite