Section : Estimation ponctuelle
Précédent : Modèles paramétrés
Suivant : Qualités d'un estimateur

Estimateurs et estimations

Quand une famille de lois, dépendant du paramètre inconnu $ \theta$ a été choisie, c'est de l'échantillon et de lui seul, que l'on peut tirer les informations. On appelle estimateur du paramètre $ \theta$, toute fonction de l'échantillon, prenant ses valeurs dans l'ensemble des valeurs possibles pour $ \theta$. Evidemment, cette définition un peu vague cache l'espoir que les valeurs prises par l'estimateur soient proches de la valeur cible $ \theta$, qui est et restera inconnue.

Il importe de bien distinguer les variables aléatoires, liées à la modélisation, de leurs réalisations, identifiées aux données. Un échantillon (théorique) est un $ n$-uplet de variables aléatoires indépendantes et de même loi $ P_\theta$. Pour estimer $ \theta$, on propose un estimateur, fonction de l' échantillon :

$\displaystyle T = \tau(X_1,\ldots,X_n)\;.
$

C'est aussi une variable aléatoire. Le choix du modèle et de l'estimateur $ T$ est déconnecté du recueil des données. C'est en quelque sorte une planification que l'on effectue avant toute observation, et qui pourra servir à plusieurs échantillons observés du même phénomène.

Une fois un modèle choisi, on considèrera un $ n$-uplet de données $ (x_1,\ldots,x_n)$ comme une réalisation des variables aléatoires $ (X_1,\ldots,X_n)$. La valeur (réelle) prise par $ T$ :

$\displaystyle \widehat{\theta}=\tau(x_1,\ldots,x_n)\;,
$

est l'estimation (du paramètre au vu de l'échantillon observé).


Prenons l'exemple simple d'une pièce dont on ignore si elle est ou non truquée. La probabilité de tomber sur pile est le paramètre inconnu $ \theta=p$. On se propose de réaliser 10 lancers de la pièce, que l'on modélisera par un échantillon de taille 10 de la loi de Bernoulli de paramètre $ p$. Le nombre de pile obtenu sur les 10 lancers est une variable aléatoire qui suit la loi binomiale $ {\cal B}(10,p)$. Le quotient de cette variable aléatoire par $ n$ (la fréquence) est un estimateur de $ p$. Effectuons maintenant les dix lancers en notant chaque fois 1 si pile sort, et 0 si c'est face. Une réalisation de l'échantillon est par exemple :

$\displaystyle 0\;,\;1\;,\;1\;,\;0\;,\;1\;,\;1\;,\;1\;,\;0\;,\;0\;,\;1\;.
$

Pour cette réalisation, la fréquence empirique prend la valeur 0.6, que l'on proposera comme estimation de $ p$. Bien évidemment, 10 nouveaux lancers de la même pièce pourront conduire à une réalisation différente de l'échantillon, et à une estimation différente de $ p$.



Section : Estimation ponctuelle
Précédent : Modèles paramétrés
Suivant : Qualités d'un estimateur