L’interprétation des chiffres : pas si simple ?

Aujourd’hui, pas un jour ne se passe sans que l’on soit submergé par des indicateurs, que ce soit par les publicitaires, les politiciens, les journalistes, les entreprises privées ou même les médecins et chercheurs…

“Without data you are just another person with an opinion”,  disait W. Edward Deming. 

En soit, c’est pour nous une très bonne chose de s’appuyer sur des données factuelles, mais dans de nombreux cas les chiffres énoncés et les plus largement partagés  peuvent s’avérer au mieux “compliqués à interpréter”, au pire, complètement faux.

C’est d’autant plus vrai en cette période de pandémie mondiale où nous sommes tous les jours exposés à des indicateurs et des chiffres, et nous pensons que nous ne sommes pas les seuls “stateux” à avoir été surpris par les chiffres partagés et repris en boucle ces derniers temps…  

L’idée de cet article est de vous donner les principaux points à prendre en compte quand vous rencontrez un indicateur quel qu’il soit (même la météo :) ) afin de profiter pleinement de l’information que l’on vous transmet.

I Identifier la source de données & la méthode de calcul 

Le premier point quand on vous annonce un chiffre est de connaître son origine et la méthode utilisée pour récupérer les données associées, cela permet de vérifier sa pertinence et sa justesse.

Typiquement au début de l’épidémie du coronavirus, tous les indicateurs utilisant le nombre de contaminés étaient en soit incomplets puisque nous étions incapables de repérer toutes les personnes contaminées (il aurait fallu pour cela pouvoir tester une grande partie de la population). Pourtant l’indicateur du taux de mortalité était diffusé allègrement dans les journaux et utilisé dans la communication notamment pour comparer les pays entre eux ce qui n’a pas de sens (car certains pays testent beaucoup plus que d’autres, ce qui fausse l’indicateur!)

 

II Prendre des précautions avec les indicateurs “macroscopiques”

Les données sources étant souvent trop volumineuses on est souvent obligé de présenter l’information via des indicateurs plus “macro” avec lesquels il faut être très prudent sur les conclusions que l’on tire et sur les prises de décision éventuelles. 

Prenons par exemple le salaire moyen des français. Aujourd’hui celui-ci est de 2 340 € nets / mois et il était de 1 938 € en 2006* (sources Insee). Si on s’en tient à cela on peut en déduire que les français gagnent en moyenne 402 € de plus qu’en 2006.

Mais si on creuse un peu on se rend compte que c’est plus compliqué, la médiane, elle, a augmenté moins vite,  234 € sur la même période (1555 € en 2006 vs 1789€ en 2021) . Du coup les riches sont-ils plus riches qu’avant ? Les pauvres plus pauvres ? Y-a-t-il plus de chômage ? L’inflation a-t-elle augmenté? A-t-on annexé la Suisse ? Bref, difficile d’y répondre comme cela et de tirer une conclusion uniquement sur la moyenne.
Ce n'est pas parce que le salaire augmente

Cela est valable bien évidemment pour tous les indicateurs “macro” tels que les pourcentages et  la médiane. 

Il faut toujours prendre un peu de recul et comprendre le contexte de ces indicateurs et sélectionner celui qui répondra le mieux à la question que vous vous posez mais aucun ne pourra répondre à toutes en même temps.

 

III Accepter les erreurs de prédiction 

On rencontre dans notre quotidien de plus en plus de prédictions / estimations, que ce soit la météo, mais aussi un prix de vente d’appartement, le temps de guérison pour une maladie ou encore la prédiction du nombre de malades. Bien que souvent fiables, il faut tout de même les prendre avec du recul car la réalité peut, in fine, différer de la “prédiction”. Cela paraît très simple dit comme ça, mais nous avons souvent tendance à l’oublier !

Il faut avoir en tête que pour effectuer une prédiction  l’algorithme utilisé s’appuie sur les données observées dans le passé et sur les données du moment. Les algorithmes sont donc limités à ce qui s’est passé et a été capté dans les données. 

De ce fait, il ne faut jamais prendre une prédiction comme un “ acquis” mais plutôt comme une “tendance”, il est également important de jeter un œil à l’indice de confiance associé qui est souvent fourni (plus il est élevé plus la prédiction est précise). Par exemple une prédiction pour le prix d’un appartement de 70 m²  à Paris sera beaucoup plus fiable que pour un 600 m²  car les appartements de 70m² sont beaucoup plus nombreux et qu’il existe donc plus de données à leur sujet (hors effet Covid, bien sûr!). 

 

IV Identifier les visualisations trompeuses

Dernier point important et non des moindre : toujours, faire attention aux visualisations qui comme les indicateurs “macro” peuvent être délicates à manipuler ou pire, utilisées pour influencer plutôt qu’informer!
Nous reviendrons sur le sujet de la data visualisation plus en détail dans de prochains articles et en attendant,  voici un très bon exemple qui à eu lieu durant les élections et qui minimise clairement l’abstention 

Illu interprétabilité-3

Conclusion

4 bons reflexes

Mark Twain disait   There are three kinds of lies: lies, damned lies, and statistics. »

Mais vous avez désormais les principales clés vous permettant d’interpréter et prendre du recul sur les chiffres qui vous sont quotidiennement présentés !

 

Article écrit par Anne-Sophie LAUGIER, Louis-Baptiste FRANCE

Laisser un commentaire