Section : Tests sur des échantillons gaussiens
Précédent : Analyse de variance
Suivant : Modèle linéaire

Test de corrélation

Le test du chi-deux de contingence vise à tester l'indépendance de deux caractères statistiques. Dans le cadre gaussien (et dans ce cadre seulement) deux variables aléatoires sont indépendantes si et seulement si elles sont non corrélées. Le problème ici est de décider si une corrélation observée entre deux caractères statistiques, mesurés sur les mêmes individus, est ou non significative.

Pour le modèle probabiliste, les observations proviennent d'un échantillon
$ ((X_1,Y_1),\ldots,(X_n,Y_n))$ d'une loi normale bidimensionnelle, d'espérance $ (\mu_x,\mu_y)$ et de matrice de covariance :

\begin{displaymath}
\left(
\begin{array}{cc}
\sigma_x^2&\sigma_x\sigma_y\rho\\
\sigma_x\sigma_y\rho&\sigma_y^2\\
\end{array}\right)\;.
\end{displaymath}

C'est la loi d'un couple de variables, dont les espérances respectives sont $ \mu_x$ et $ \mu_y$ et les variances $ \sigma_x^2$ et $ \sigma_y^2$, le coefficient de corrélation étant $ \rho$. L'estimateur naturel de $ \rho$ est le coefficient de corrélation empirique, à savoir la variable aléatoire $ R$ suivante :

$\displaystyle R = \frac{\displaystyle{\sum_{i=1}^n(X_i-\overline{X})(Y_i-\overl...
...\sum_{i=1}^n(X_i-\overline{X})^2}
\sqrt{\sum_{i=1}^n(Y_i-\overline{Y})^2}}}\;,
$

$ \overline{X}$ et $ \overline{Y}$ désignent les moyennes empiriques des $ X_i$ et des $ Y_i$ respectivement. L'hypothèse nulle que l'on souhaite tester est :

$\displaystyle {\cal H}_0\;:\;\rho = 0\;.
$

On utilise pour cela le résultat suivant :

Théorème 3.8   Si $ {\cal H}_0$ est vraie, alors la statistique :

$\displaystyle T=\sqrt{n-2} \frac{R}{\sqrt{1-R^2}}\;,
$

suit la loi de Student $ {\cal T}(n\!-\!2)$.

Le test bilatéral de seuil $ \alpha$ aura pour règle de décision :

   Rejet de $\displaystyle {\cal H}_0\;\Longleftrightarrow\;
T\notin [\,Q_{{\cal T}(n-2)}(\alpha/2)\,,\,
Q_{{\cal T}(n-2)}(1-\alpha/2)\,]\;.
$



Section : Tests sur des échantillons gaussiens
Précédent : Analyse de variance
Suivant : Modèle linéaire