Benford en pratique
Bonjour,
je voudrais des pistes pour appliquer la loi de Benford à des données réelles (pour "décider" de si certaines données sont "normales" ou "anormales"). Je suis au courant qu'épistémologiquement, c'est une position un peu difficile à tenir, mais disons que je n'agis pas tout à fait sous ma propre volonté.
je voudrais des pistes pour appliquer la loi de Benford à des données réelles (pour "décider" de si certaines données sont "normales" ou "anormales"). Je suis au courant qu'épistémologiquement, c'est une position un peu difficile à tenir, mais disons que je n'agis pas tout à fait sous ma propre volonté.
J'ai lu ici et ici qu'il ne faut pas appliquer la loi du $\chi^2$, et que le test de la distance euclidienne normalisée entre les vecteurs des fréquences et le vecteur des probabilités est meilleur. Sur les données que j'ai, il n'y en a qu'une petite minorité qui passe le test statistique "si $distance \leq 1.330$, conclure que ça suit la loi de Benford, et conclure que non sinon" ($1.330$ étant choisi pour que si les données suivent vraiment la loi de Benford, le test échoue avec probabilité inférieure à $0,05$).
Ensuite, je me suis demandé s'il était possible d'avoir une sorte de paradoxe de Benford-Simpson : est-ce que si un jeu de données $X$ passe le test, et un jeu de données $Y$ passe le test aussi, est-ce que le jeu de données concaténé $X \frown Y$ passe le test aussi ? Après une petite expérimentation, pour la loi de Benford sur le premier chiffre de l'écriture de décimale, pour des $X$ et $Y$ tirés justement selon la loi de Benford, indépendants, de longueur $100$, en répétant l'expérience $1000$ fois, j'obtiens une vingtaine de "paradoxes" (i.e. $X$ et $Y$ passent le test, tandis que $X\frown Y$ ne le passe pas). On pouvait aussi donner l'exemple trivial $X = [1,1]$ et $Y = [1,1]$. Dans ce cas, le score de $X$ (et de $Y$) vaut environ $1,061$ tandis que celui de $[1,1,1,1]$ vaut environ $1,501$.
Bref... Quand tout le monde crie que la loi de Benford est appliquée à la détection de fraudes, qu'est-ce que les gens font réellement ?
Connectez-vous ou Inscrivez-vous pour répondre.
Réponses
Cordialement.
Donc c'est normal qu'il y en ait un peu moins !