Etant donné un
échantillon
observé
et
une
loi de probabilité
, la
vraisemblance
quantifie la
probabilité
que les observations proviennent effectivement
d'un
échantillon
(théorique) de la loi
.
Prenons l'exemple de 10 lancers de pièce. L'échantillon binaire observé est par exemple :
Il est naturel de choisir comme
estimation
de , celle
pour laquelle la
probabilité
de l'
échantillon
observé est la plus
forte, à savoir ici
0.6.
L'interprétation est la suivante. Considérons
un
échantillon
théorique
de la loi
.
Par définition, les
variables aléatoires
sont
indépendantes
et de même loi
. Donc la probabilité
que
l'échantillon
théorique
ait pour réalisation
l'échantillon
observé
est le produit des probabilités
pour que
prenne la valeur
, à savoir :
Dans le cas d'un
modèle
continu, la loi a une
densité
sur
, et la
probabilité
pour que
l'échantillon
prenne une
valeur particulière est toujours nulle. Il faut alors remplacer la
probabilité
par sa
densité
dans la définition de
la
vraisemblance.
Estimer un paramètre par la méthode du
maximum de vraisemblance,
c'est proposer comme valeur de ce paramètre celle qui rend maximale
la
vraisemblance,
à savoir la
probabilité
d'observer les données
comme réalisation d'un
échantillon
de la loi .
On l'appelle estimation par maximum de vraisemblance.
Si
est un
échantillon
(théorique) de la loi
, la
variable aléatoire
:
Reprenons l'exemple de la
loi uniforme
sur l'intervalle
.
Sa
densité
est :
Vue comme fonction de , la
vraisemblance
est nulle si
est inférieur à la plus grande des valeurs observées, elle vaut
sinon. Elle est donc maximale pour :
Pour la plupart des lois de probabilité usuelles, l'estimateur du maximum de vraisemblance est défini de façon unique, et se calcule explicitement. Sur le plan théorique, il présente de nombreux avantages. Sous des hypothèses vérifiées par de nombreux modèles courants, on démontre qu'il est asymptotiquement sans biais et convergent. On démontre de plus que sa variance est minimale. La méthode du maximum de vraisemblance est donc théoriquement la meilleure des méthodes d'estimation. Nous verrons au paragraphe suivant des exemples de calculs explicites. Quand une détermination explicite est impossible, il faut avoir recours à une détermination numérique, par un algorithme d'optimisation.