Le principe de la régression au sens des moindres carrés, tel qu'il a été décrit au paragraphe précédent, est très général. Etant donné un caractère "à expliquer" et des caractères "explicatifs", mesurés sur une même population de taille , on cherche à isoler dans une famille de fonctions à plusieurs paramètres, une fonction qui "explique" par la relation :
Comme critère de choix, on minimise sur toutes les fonctions de la famille l'erreur quadratique définie par :
Dans certains cas classiques, on sait résoudre explicitement ce problème de minimisation, et la solution est implémentée dans les environnements de calculs statistiques. C'est le cas pour les exemples que nous donnons ci-dessous. Quand une résolution explicite est impossible, on a recours à des algorithmes de minimisation, comme l'algorithme du gradient.
C'est la généralisation directe de la
régression linéaire simple
du paragraphe précédent. Les fonctions sont affines :
L'erreur quadratique à minimiser est une fonction des paramètres inconnus .
On peut toujours faire passer un hyperplan par points dans un espace de dimension . Si la taille de la population est inférieure ou égale à , l'erreur quadratique minimale est donc 0. En pratique, la régression ne pourra être significative que si est beaucoup plus grand que .
Régression polynomiale
simple.
On peut la voir comme une autre généralisation de la
régression linéaire simple,
ou comme un cas particulier de
Régression linéaire multiple.
Un seul
caractère, , est explicatif. Les fonctions sont
les polynômes de degré .
On peut considérer que les caractères sont explicatifs pour se ramener au cas précédent. Les familles des polynômes de degrés successifs sont emboîtées. Pour un même ensemble de données, l'erreur quadratique diminuera donc si on augmente , pour s'annuler quand dépasse . Mais si est trop grand, la régression ne sera pas significative. En pratique, il est rare qu'une régression polynomiale aille au-delà du degré 3.
Régression polynomiale
multiple.
Quand plusieurs
caractères
sont explicatifs, on peut encore effectuer une
régression sur une famille
de polynômes en les différents
caractères,
de degré fixé. Les termes
faisant intervenir des produits du type
seront
interprétés comme des termes d'interaction entre les caractères
explicatifs. En pratique, on se limite à des polynômes de degré
1 ou 2. Voici pour deux
caractères
explicatifs et ,
les
modèles
les plus fréquemment utilisés.