La taille de l'empereur de Chine (conte)


C. Robert


Il était une fois, il y a bien longtemps, un empereur de Chine de grande taille, sans toutefois qu'on puisse le qualifier de géant. Quand il entra dans sa soixantième année, on donna l'ordre au Sculpteur Impérial d'édifier une statue de cet empereur, grandeur nature. Il exigea pour cela de connaître la taille exacte de son modèle. Mais voilà : il est tout à fait contraire au protocole de mesurer l'empereur avec une simple toise. Comment faire ? Une solution statistique à ce problème fit l'unanimité, bien que le Statisticien Impérial, seul statisticien du royaume, ait malheureusement été absent à ce moment là.

Il fut ainsi décidé d'envoyer 100 enquêteurs dans tout le royaume, qui demanderaient à des sujets de l'empereur "Quelle est la taille de l'empereur de Chine ?". Ainsi fut-il fait, et exactement 10 000 réponses furent collectées.

Dès son retour, le Statisticien Impérial reçut l'ordre de traiter ces 10 000 données. Il fit remarquer, non sans mauvaise humeur, qu'il fallait toujours consulter le statisticien avant le recueil des données. On lui répondit que s'il était vraiment mécontent, il serait exécuté, ce qui lui ôterait tout sujet de mécontentement. Sinon, il disposait de deux mois pour trouver la taille parfaitement exacte de l'empereur, ce que le nombre de sujets interrogés et l'art de la statistique permettait sûrement.

Deux mois après, au cours d'une magnifique cérémonie, le Statisticien Impérial annonça publiquement que la taille de l'empereur était de 1,987654321 mètres. Dans un premier temps, l'empereur fut enchanté de savoir qu'il mesurait scientifiquement une taille aussi élégante ; les enquêteurs, qui avaient recueilli des tailles au centimètre près, furent émerveillés de la précision du résultat statistique ; les ambassadeurs allèrent partout dans le monde vanter la taille remarquable de l'empereur de Chine. Seul le Sculpteur Impérial fut morose ce jour là : comment faire une statue qui aurait exactement 1,987654321 mètres de haut ?

Le Statisticien Impérial vécut longtemps et heureux. Le Sculpteur n'eut pas l'occasion d'être morose très longtemps. Dans son extrême vieillesse l'empereur sombra dans la fascination de sa taille et de tout ce qui était haut. Aussi, lorsqu'un ambassadeur, de retour d'une chasse à l'arc en Afrique, lui rapporta, dessins à l'appui, que "La girafe est l'animal terrestre le plus grand. L'adulte mesure environ 6m de haut, son poids est d'environ 1300 kg et son cou mesure environ 2,5 m", il quitta son royaume à la recherche de tels animaux. On n'entendit plus jamais parler de lui.

Quelques siècles plus tard, on retrouva par hasard une partie des mémoires du Statisticien Impérial, dans laquelle il relatait l'épisode de la détermination de la taille de l'empereur.

On retrouva ainsi l'histogramme des 10 000 données (figure 1). Cet histogramme avait laissé le Statisticien Impérial perplexe : pourquoi les données recueillies ne se regroupaient-elles pas autour d'une valeur, qui serait une approximation de la taille de l'empereur ? Pourquoi les données étaient -elles ainsi presque uniformément réparties entre 1,9 et 2,1 mètres ? En tel cas, était-il justifié de prendre la moyenne ou la médiane des données comme approximation de la taille de l'empereur ? Bref, comment répondre à la question posée ? D'ailleurs, que signifie "la taille exacte de l'empereur" ?


Figure 1 : Histogramme des estimations de la taille de l'empereur pour les 10 000 données. Le pas est de 2 cm.

Le Statisticien Impérial jugea que ni la moyenne, ni la médiane de la série ne pouvait convenir. La situation était pour le moins inconfortable. Sans se décourager, il mena lui-même une petite enquête parallèle en interrogeant 200 personnes, dans l'entourage de l'empereur. L'histogramme des 200 valeurs ainsi recueillies, reproduit figure 2, était plus conforme à ce qu'on attend de mesures d'une même longueur. La moyenne de cette série était de 1,98 mètres et la médiane de 1,99 mètres.


Figure 2 : Histogramme des 200 données recueillies par le Statisticien Impérial.

Les données recueillies dans les deux séries étaient fournies au centimètre près. Dès lors, la taille de l'empereur sera estimée, au mieux, à 1 cm près. Mais évidemment, une réponse à ±1 cm près était très risquée. Le Statisticien explique dans ses mémoires son choix de donner une réponse, ayant un ordre de grandeur crédible, et dont la précision et le caractère remarquable des chiffres enchanteraient l'empereur.

Le Statisticien Impérial chercha aussi à savoir pourquoi les 10 000 données de l'enquête officielle étaient aussi éparpillées. Il définissait une série statistique comme une série de données dont on sait à la fois comment et pourquoi elles ont été recueillies, et destinée à subir des traitements statistiques. Ici, il savait pourquoi ces données avaient été recueillies mais le comment restait vague. Il interrogea donc les enquêteurs. Il apprit ainsi que chaque enquêteur avait choisi dix villes ou villages au hasard, et dans chaque village avait interrogé 10 personnes au hasard. La seule question posée, à laquelle il était ordonné de répondre, concernait la taille de l'empereur. On avait omis de demander si le sujet avait vu l'empereur au moins une fois dans sa vie. Les enquêteurs avouèrent que de nombreux sujets interrogés avaient spontanément dit ne l'avoir jamais vu. C'était une explication possible…Dans ses mémoires, le Statisticien Impérial remarqua que ce n'était finalement pas une situation très différente de celle de nombreuses enquêtes Impériales, où une majorité des sujets interrogés n'avaient pas d'éléments leur permettant de donner une réponse sensée.

Enfin, parmi les réflexions consignées dans ses mémoires, le Statisticien Impérial concluait qu'il existait aussi d'autres moyens pour connaître la taille de l'empereur, tout en respectant le protocole. On aurait ainsi pu, dit-il, mesurer l'ombre de l'empereur et en déduire sa taille.