Jusqu'ici le seul
modèle probabiliste
que nous ayons envisagé pour
des
données
observées considérait qu'elles étaient
des réalisations de
variables indépendantes
et de même loi.
Cela revient à supposer
que les individus sur lesquels les
données
ont été recueillies sont
interchangeables, et que les différences observées entre eux sont
seulement imputables
au hasard.
Dans de nombreuses situations,
on cherche à expliquer ces différences, c'est-à-dire à les
attribuer à l'effet d'autres
caractères
mesurés sur les mêmes
individus. La
modélisation
probabiliste considèrera
que la mesure (à expliquer) effectuée sur un
individu
donné
est une
variable aléatoire,
dont la loi dépend des valeurs prises
sur cet
individu
par les
caractères
explicatifs, considérés comme
déterministes. Si désigne la
variable aléatoire
associée
à
l'individu
, et
les valeurs
prises pour cet
individu
par les
caractères
explicatifs
, on séparera l'effet déterministe et l'effet
aléatoire
par un
modèle
du type :
Dans certains cas classiques, on sait résoudre explicitement ce problème de minimisation, et la solution est implémentée dans les environnements de calculs statistiques. Quand une résolution explicite est impossible, on a recours à des algorithmes de minimisation, comme l'algorithme du gradient.
Le cas le plus fréquent est celui de la
régression linéaire simple,
où un seul
caractère
est explicatif, et la fonction est
affine :
La valeur de ce minimum est :
Les
variables aléatoires
et
sont les
estimateurs
des
moindres carrés
des paramètres
et
.
On peut utiliser les estimateurs des moindres carrés pour estimer les paramètres de certaines lois, dans un problème d'ajustement. Nous traitons à titre d'exemple les lois normales et les lois de Weibull.
Soit
un
échantillon
de taille
de la
loi normale
, les paramètres
et
étant inconnus. Pour
, notons
les
statistiques d'ordre
(valeurs
ordonnées de la plus grande à la
plus petite). Si l'hypothèse
de normalité est pertinente,
alors
doit être proche du quantile
de la loi
.
Rappelons que si une
variable aléatoire
suit la loi
,
alors
suit la loi
. Ceci revient
à dire que pour tout
[0,1] :
La
fonction quantile
de la
loi de Weibull
est :
Posons
et
. Les points
devraient être proches de la droite d'équation
. Les
estimateurs
des
moindres carrés
et
pour la
régression linéaire simple
des
sur les
sont des
estimateurs
de
et
respectivement.
Donc
et
sont des
estimateurs
de
et
respectivement.