Il était une fois, il y a bien longtemps, un empereur de Chine de grande taille,
sans toutefois qu'on puisse
le qualifier de géant. Quand il entra dans sa soixantième année, on
donna l'ordre au Sculpteur
Impérial d'édifier une statue de cet empereur, grandeur nature. Il exigea
pour cela de connaître
la taille exacte de son modèle. Mais voilà : il est tout à fait
contraire au protocole de mesurer
l'empereur avec une simple toise. Comment faire ? Une solution
statistique
à ce problème fit
l'unanimité, bien que le Statisticien Impérial, seul statisticien du royaume,
ait malheureusement
été absent à ce moment là.
Il fut ainsi décidé d'envoyer 100 enquêteurs dans tout le royaume, qui demanderaient à des sujets de l'empereur "Quelle est la taille de l'empereur de Chine ?". Ainsi fut-il fait, et exactement 10 000 réponses furent collectées.
Dès son retour, le Statisticien Impérial reçut l'ordre de traiter ces 10 000 données. Il fit remarquer, non sans mauvaise humeur, qu'il fallait toujours consulter le statisticien avant le recueil des données. On lui répondit que s'il était vraiment mécontent, il serait exécuté, ce qui lui ôterait tout sujet de mécontentement. Sinon, il disposait de deux mois pour trouver la taille parfaitement exacte de l'empereur, ce que le nombre de sujets interrogés et l'art de la statistique permettait sûrement.
Deux mois après, au cours d'une magnifique cérémonie, le Statisticien Impérial annonça publiquement que la taille de l'empereur était de 1,987654321 mètres. Dans un premier temps, l'empereur fut enchanté de savoir qu'il mesurait scientifiquement une taille aussi élégante ; les enquêteurs, qui avaient recueilli des tailles au centimètre près, furent émerveillés de la précision du résultat statistique ; les ambassadeurs allèrent partout dans le monde vanter la taille remarquable de l'empereur de Chine. Seul le Sculpteur Impérial fut morose ce jour là : comment faire une statue qui aurait exactement 1,987654321 mètres de haut ?
Le Statisticien Impérial vécut longtemps et heureux. Le Sculpteur n'eut pas l'occasion d'être morose très longtemps. Dans son extrême vieillesse l'empereur sombra dans la fascination de sa taille et de tout ce qui était haut. Aussi, lorsqu'un ambassadeur, de retour d'une chasse à l'arc en Afrique, lui rapporta, dessins à l'appui, que "La girafe est l'animal terrestre le plus grand. L'adulte mesure environ 6m de haut, son poids est d'environ 1300 kg et son cou mesure environ 2,5 m", il quitta son royaume à la recherche de tels animaux. On n'entendit plus jamais parler de lui.
Quelques siècles plus tard, on retrouva par hasard une partie des mémoires du Statisticien Impérial, dans laquelle il relatait l'épisode de la détermination de la taille de l'empereur.
On retrouva ainsi
l'histogramme
des 10 000
données
(figure 1). Cet
histogramme
avait
laissé le Statisticien Impérial perplexe : pourquoi les
données
recueillies ne se regroupaient-elles pas autour d'une valeur, qui serait une approximation
de la taille de l'empereur ? Pourquoi les
données
étaient -elles ainsi presque
uniformément réparties entre 1,9 et 2,1 mètres ? En tel cas, était-il
justifié de prendre la
moyenne
ou la
médiane
des
données
comme approximation
de la taille de l'empereur ? Bref, comment répondre à la question posée ?
D'ailleurs, que signifie "la taille exacte de l'empereur" ?
Le Statisticien Impérial jugea que ni la
moyenne,
ni la
médiane
de la
série ne pouvait convenir. La situation était pour le moins inconfortable.
Sans se décourager, il mena lui-même une petite enquête parallèle
en interrogeant 200 personnes, dans l'entourage de l'empereur.
L'histogramme
des 200 valeurs
ainsi recueillies, reproduit figure 2, était plus conforme à ce qu'on attend
de mesures d'une même longueur. La
moyenne
de cette série était de 1,98
mètres et la
médiane
de 1,99 mètres.
Les données recueillies dans les deux séries étaient fournies au centimètre près. Dès lors, la taille de l'empereur sera estimée, au mieux, à 1 cm près. Mais évidemment, une réponse à ±1 cm près était très risquée. Le Statisticien explique dans ses mémoires son choix de donner une réponse, ayant un ordre de grandeur crédible, et dont la précision et le caractère remarquable des chiffres enchanteraient l'empereur.
Le Statisticien Impérial chercha aussi à savoir pourquoi les 10 000 données de l'enquête officielle étaient aussi éparpillées. Il définissait une série statistique comme une série de données dont on sait à la fois comment et pourquoi elles ont été recueillies, et destinée à subir des traitements statistiques. Ici, il savait pourquoi ces données avaient été recueillies mais le comment restait vague. Il interrogea donc les enquêteurs. Il apprit ainsi que chaque enquêteur avait choisi dix villes ou villages au hasard, et dans chaque village avait interrogé 10 personnes au hasard. La seule question posée, à laquelle il était ordonné de répondre, concernait la taille de l'empereur. On avait omis de demander si le sujet avait vu l'empereur au moins une fois dans sa vie. Les enquêteurs avouèrent que de nombreux sujets interrogés avaient spontanément dit ne l'avoir jamais vu. C'était une explication possible…Dans ses mémoires, le Statisticien Impérial remarqua que ce n'était finalement pas une situation très différente de celle de nombreuses enquêtes Impériales, où une majorité des sujets interrogés n'avaient pas d'éléments leur permettant de donner une réponse sensée.
Enfin, parmi les réflexions consignées dans ses mémoires, le Statisticien
Impérial concluait qu'il existait aussi d'autres moyens pour connaître la taille de
l'empereur, tout en respectant le protocole. On aurait ainsi pu, dit-il, mesurer l'ombre de
l'empereur et en déduire sa taille.