Que cherchez-vous ?

Publicité
10 juin 2020
Temps de lecture : 3 minutes

Repérer les fraudes en épidémiologie grâce au chiffre 1

Pixabay

Repérer de la fraude simplement grâce à la surreprésentation du chiffre 1? Dans certains cas, c’est possible, si on se fie à une étrangeté mathématique qu’on retrouve dans des données de tous horizons .

Qu’ont en commun les données épidémiologiques de la COVID-19, la suite de Fibonacci, la luminosité d’étoiles et des revenus d’entreprises? Il ne s’agit pas d’une théorie du complot, mais plutôt un phénomène statistique surprenant : la loi de Benford.

Lorsqu’on choisit aléatoirement un nombre dans un ensemble de données, on peut intuitivement croire que les chances qu’il débute par n’importe quel chiffre entre 1 et 9 sont égales (11,11% c’est-à-dire 1/9). Mais en réalité, vous risquez de croiser beaucoup plus de nombres commençant par 1, 2 ou 3 que par 7, 8, ou 9.

En fait, dans beaucoup de cas (mais pas tous) les probabilités qu’un nombre tiré d’un ensemble de données aléatoires commence par le chiffre 1 sont de 30,1%, puis tombent à 17,6% pour le 2, à 12,5% pour le 3, jusqu’à un infime 4,6% pour le 9.

La loi de Benford surprend les chercheurs depuis presque 150 ans. « Le phénomène a été découvert deux fois dans l’histoire », explique Jean-François Cœurjolly, professeur au département de mathématiques de l’Université du Québec à Montréal.

Publicité