Dans la plupart des cas d'intérêt pratique, la loi , et
donc aussi la
vraisemblance,
ont une expression dérivable par
rapport à
. Pour calculer le maximum de la
vraisemblance,
il faut déterminer les valeurs pour lesquelles la dérivée
de la
vraisemblance
s'annule. Or par définition, la
vraisemblance
est un produit de
probabilités
ou de
densités,
qui peut être
assez compliqué à dériver. Il est préférable
de dériver une somme, et c'est pourquoi on commence par remplacer
la
vraisemblance
par son logarithme. La fonction logarithme étant croissante,
il est équivalent de maximiser
ou
. Une fois déterminée une valeur de
pour laquelle la dérivée s'annule, il faut s'assurer à l'aide
de la dérivée seconde que ce point est bien un maximum.
Nous traitons ci-dessous quelques familles classiques.
L'ensemble des valeurs possibles est . Le paramètre
inconnu est
.
Si
est un
échantillon, la
vraisemblance
vaut :
L'ensemble des valeurs possibles est
. Le paramètre
inconnu est
.
Si
est un
échantillon
d'entiers, la
vraisemblance
vaut :
Le paramètre inconnu est encore . Il s'agit ici de
lois continues,
la
vraisemblance
est donc un produit de valeurs de la
densité. Pour
un
-uplet de réels positifs
elle vaut :
Lois normales
Pour un paramètre multidimensionnel, le principe est le même, mais
les calculs d'optimisation sont plus compliqués. Pour les lois normales,
deux paramètres sont inconnus. Afin d'éviter les confusions dans
les dérivations, nous noterons le paramètre de
variance,
habituellement noté
.
Pour un
-uplet de réels
la
vraisemblance
vaut :