{"id":7078,"date":"2022-12-14T22:03:31","date_gmt":"2022-12-14T21:03:31","guid":{"rendered":"https:\/\/variances.eu\/?p=7078"},"modified":"2022-12-14T22:04:37","modified_gmt":"2022-12-14T21:04:37","slug":"donnees-en-vrac-quand-benford-remet-de-lordre","status":"publish","type":"post","link":"https:\/\/variances.eu\/?p=7078","title":{"rendered":"Donn\u00e9es en vrac : quand Benford remet de l\u2019ordre"},"content":{"rendered":"<h3><strong>Un jeu in\u00e9quitable\u2026 mais pas dans le sens escompt\u00e9\u00a0<\/strong><strong>!<\/strong><\/h3>\n<p>Accepteriez-vous de jouer avec moi au jeu suivant\u00a0? Dans la derni\u00e8re \u00e9dition du <em>Wall Street Journal<\/em>, extrayons \u00ab\u00a0au hasard\u00a0\u00bb mille donn\u00e9es chiffr\u00e9es positives, portant sur les cours de bourse, les taux d\u2019int\u00e9r\u00eat, les taux de change, etc., et ne retenons, pour chaque donn\u00e9e \u00e9l\u00e9mentaire, que son premier chiffre significatif\u00a0: le premier \u00e0 gauche, si la donn\u00e9e est un nombre sup\u00e9rieur \u00e0 1, ou le premier chiffre non nul plac\u00e9 apr\u00e8s la virgule, si la donn\u00e9e est comprise entre 0 et 1. Chaque fois que ce premier chiffre significatif est un 1, un 2, ou un 3, vous me payez un euro, et sinon c\u2019est moi qui vous verse un euro. Je vous sens plut\u00f4t partant\u00a0! Avec six chiffres gagnants en votre faveur, contre seulement trois pour moi, vous pensez sans doute \u00ab\u00a0raisonnablement\u00a0\u00bb gagner dans environ 2\/3 des cas, contre seulement 1\/3 pour moi, et donc empocher \u00e0 peu pr\u00e8s (2\/3 \u2013 1\/3) x 1000 = 333 \u20ac, apr\u00e8s les mille coups de notre partie\u00a0! C\u2019est \u00e9trange, parce que, de mon c\u00f4t\u00e9, j\u2019ai un pressentiment inverse : c\u2019est moi, et non pas vous, qui vais l\u2019emporter en empochant environ 200\u00a0\u20ac. Vous ne me croyez pas\u00a0? Libre \u00e0 vous et, puisque tel est votre bon vouloir, jouons et nous en aurons le c\u0153ur net\u00a0!<\/p>\n<p>Une heure plus tard\u2026 Vous avez perdu 200 \u20ac\u00a0et vous n\u2019en revenez pas\u00a0? Vous estimez que j\u2019ai b\u00e9n\u00e9fici\u00e9 d\u2019une chance extraordinaire, d\u00e9fiant toute loi acceptable du hasard\u00a0? Eh bien, d\u00e9trompez-vous : cette issue \u00e9tait parfaitement pr\u00e9visible et se reproduirait syst\u00e9matiquement, si nous rejouions un tr\u00e8s grand nombre de parties, \u00e0 partir de sources de donn\u00e9es tr\u00e8s diverses\u00a0: avec une autre \u00e9dition du <em>Wall Street Journal<\/em>\u00a0; avec un quelconque journal financier, europ\u00e9en, am\u00e9ricain ou japonais, les montants mon\u00e9taires y \u00e9tant exprim\u00e9s en euros, en dollars ou en yens\u00a0; ou encore, avec un atlas g\u00e9ographique recensant les longueurs des fleuves et les superficies des lacs\u00a0; ou encore, avec un trait\u00e9 d\u2019astronomie empli des masses des \u00e9toiles et des distances intergalactiques ; ou encore avec un r\u00e9pertoire d\u2019adresses o\u00f9 figurent des num\u00e9ros de rues\u00a0; ou encore avec un recueil de constantes physiques\u00a0; ou encore, avec une recension de capitalisations boursi\u00e8res, un graphe des liens hypertextes pointant vers diff\u00e9rents sites, un d\u00e9compte des amis Facebook ou des volumes de tweets au sein d\u2019un panel d\u2019internautes\u00a0; ou enfin, et mieux encore que tout cela, avec une m\u00e9lange h\u00e9t\u00e9roclite de tous ces registres de donn\u00e9es. Un 1, un 2 ou un 3 sortiraient comme premier chiffre significatif dans environ 60 % des cas (et non pas seulement 33 %), si bien que vous me paieriez (60 % \u2013 40 %) x 1000 = 200\u00a0\u20ac. Surprenant, non\u00a0?<\/p>\n<h3><strong>Newcomb et Benford<\/strong><\/h3>\n<p>En 1881, l\u2019astronome am\u00e9ricain Simon Newcomb publia dans l\u2019<em>American Journal of Mathematics<\/em> un article qui passa \u00e0 l\u2019\u00e9poque presque inaper\u00e7u [1]. Il avait remarqu\u00e9 que les recueils de tables de logarithmes \u00e9taient nettement plus us\u00e9s dans leurs premi\u00e8res pages que dans les suivantes. Il en d\u00e9duisit que les utilisateurs de ces tables, dans les op\u00e9rations de multiplication qu\u2019ils devaient effectuer, avaient davantage l\u2019occasion de manipuler des nombres dont le premier chiffre significatif est bas que des nombres pour lesquels celui-ci est \u00e9lev\u00e9. Partant de ce constat, Newcomb \u00e9tablit empiriquement la loi de probabilit\u00e9s discr\u00e8te donnant les fr\u00e9quences respectives Proba(p) d\u2019apparition des diff\u00e9rents chiffres p du syst\u00e8me d\u00e9cimal (p\u00a0= 1, 2,\u2026, 9), comme premier chiffre significatif d\u2019une donn\u00e9e tir\u00e9e d\u2019un corpus disparate et sans coh\u00e9rence apparente. Il obtint ainsi une fonction Proba(p) d\u00e9croissante selon p, ayant pour expression\u00a0:<\/p>\n<p>Proba(p) = log<img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/variances.eu\/wp-content\/ql-cache\/quicklatex.com-b439879ad154070b66792558f7190ce6_l3.png\" class=\"ql-img-inline-formula quicklatex-auto-format\" alt=\"&#95;&#123;&#49;&#48;&#125;\" title=\"Rendered by QuickLaTeX.com\" height=\"10\" width=\"13\" style=\"vertical-align: -3px;\"\/>(p + 1) \u2013 log<img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/variances.eu\/wp-content\/ql-cache\/quicklatex.com-b439879ad154070b66792558f7190ce6_l3.png\" class=\"ql-img-inline-formula quicklatex-auto-format\" alt=\"&#95;&#123;&#49;&#48;&#125;\" title=\"Rendered by QuickLaTeX.com\" height=\"10\" width=\"13\" style=\"vertical-align: -3px;\"\/> p = log<img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/variances.eu\/wp-content\/ql-cache\/quicklatex.com-b439879ad154070b66792558f7190ce6_l3.png\" class=\"ql-img-inline-formula quicklatex-auto-format\" alt=\"&#95;&#123;&#49;&#48;&#125;\" title=\"Rendered by QuickLaTeX.com\" height=\"10\" width=\"13\" style=\"vertical-align: -3px;\"\/>(1 +1\/p)<\/p>\n<p>Presque 60 ans plus tard, en 1938, le physicien Frank Benford [2], qui n\u2019avait pas lu le travail de Newcomb, fait ind\u00e9pendamment le m\u00eame constat et retrouve \u00e0 son tour cette m\u00eame loi empirique, qui restera d\u00e9sormais connue sous le nom de son second d\u00e9couvreur.<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter size-full wp-image-7082\" src=\"https:\/\/variances.eu\/wp-content\/uploads\/2022\/12\/nc1-1.jpg\" alt=\"\" width=\"600\" height=\"359\" srcset=\"https:\/\/variances.eu\/wp-content\/uploads\/2022\/12\/nc1-1.jpg 600w, https:\/\/variances.eu\/wp-content\/uploads\/2022\/12\/nc1-1-300x180.jpg 300w, https:\/\/variances.eu\/wp-content\/uploads\/2022\/12\/nc1-1-440x264.jpg 440w\" sizes=\"(max-width: 600px) 100vw, 600px\" \/><\/p>\n<p>Sur le diagramme ci-dessus, figurant la loi de Benford, on observe notamment que Proba(1) + Proba(2) + Proba(3) \u2248 60 %, d\u2019o\u00f9 ma botte gagnante au jeu que je vous ai si hardiment propos\u00e9\u00a0et que vous avez si promptement accept\u00e9.<\/p>\n<p>Pourquoi, de mani\u00e8re si \u00e9trange, les plus petits chiffres du syst\u00e8me de num\u00e9ration d\u00e9cimale sont-ils de bien meilleurs candidats que les chiffres sup\u00e9rieurs, pour tr\u00f4ner en tant que premier chiffre significatif au sein d\u2019une liste de donn\u00e9es erratiques ? Pourquoi, contrairement \u00e0 l\u2019attente \u00ab\u00a0naturelle\u00a0\u00bb, chaque chiffre de 1 \u00e0 9 n\u2019a-t-il pas exactement la m\u00eame probabilit\u00e9 1\/9 d\u2019appara\u00eetre ? Pourquoi sommes-nous \u00e0 ce point victimes d\u2019un biais cognitif privil\u00e9giant \u00e0 tort la loi de distribution uniforme, c\u2019est-\u00e0-dire l\u2019\u00e9quiprobabilit\u00e9\u00a0?<\/p>\n<p>Avant de r\u00e9pondre \u00e0 ces questions, il convient de mieux circonscrire le domaine de pertinence de la loi de Benford. En effet, celle-ci ne pr\u00e9vaut pas pour tout corpus de donn\u00e9es.<\/p>\n<h3><strong>Le champ de validit\u00e9 de la loi de Benford<\/strong><\/h3>\n<p>Si, \u00e0 la diff\u00e9rence des contextes jusque l\u00e0 \u00e9voqu\u00e9s, le corpus de donn\u00e9es, au lieu d\u2019\u00eatre \u00ab\u00a0d\u00e9structur\u00e9\u00a0\u00bb,\u00a0 est au contraire hautement organis\u00e9, alors la loi de Benford est mise en d\u00e9faut. Ainsi, des num\u00e9ros t\u00e9l\u00e9phoniques tir\u00e9s de l\u2019annuaire de la r\u00e9gion sud-est auront tous pour premier chiffre significatif le 4 (04 xx xx xx), sans aucune occurrence possible des huit autres chiffres\u00a0! De m\u00eame les num\u00e9ros mobiles ne peuvent commencer que par un 6 ou un 7 et les num\u00e9ros non g\u00e9ographiques <em>via<\/em> internet, d\u00e9tiennent l\u2019exclusivit\u00e9 du 9 comme premier chiffre significatif. Un violent camouflet \u00e0 la loi\u00a0de Benford !<\/p>\n<p>Autres exceptions importantes, les corpus constitu\u00e9s \u00e0 partir de mesures d\u2019une variable concentr\u00e9e autour de sa moyenne, comme le poids ou la taille au sein d\u2019une population de r\u00e9f\u00e9rence. Imaginez que je vous propose \u00e0 nouveau de jouer, les mille donn\u00e9es \u00e9tant cette fois extraites, non pas d\u2019un journal financier, mais du fichier de la Police o\u00f9 sont consign\u00e9es les tailles des pr\u00e9venus, exprim\u00e9es dans le syst\u00e8me m\u00e9trique. Je vous promets cette fois de vous verser un euro chaque fois que le premier chiffre significatif d\u2019une taille sera sup\u00e9rieur \u00e0 1, me r\u00e9servant personnellement le 1 comme unique chiffre gagnant. Acceptez-vous encore de m\u2019affronter ? Je suis convaincu que non, assur\u00e9s comme vous l\u2019\u00eates que tr\u00e8s peu de pr\u00e9venus mesuraient moins d\u2019un m\u00e8tre, ou plus de deux, \u00e0 la date de leur arrestation. Or il faudrait pourtant quelques nains et g\u00e9ants, pour que vous puissiez gagner ne serait-ce que quelques coups de la partie\u00a0! En outre, la distribution statistique du premier chiffre significatif d\u00e9pend ici du syst\u00e8me d\u2019unit\u00e9s\u00a0: un pic tr\u00e8s pointu autour de la valeur 1, dans le syst\u00e8me m\u00e9trique, mais une r\u00e9partition plus \u00e9tal\u00e9e entre les valeurs 3, 4, 5 et 6 dans le syst\u00e8me anglo-saxon o\u00f9 la taille est mesur\u00e9e en pieds\u00a0!<\/p>\n<p>Les consid\u00e9rations pr\u00e9c\u00e9dentes dessinent en creux le domaine d\u2019application de la loi de Benford. Les deux conditions suivantes doivent \u00eatre r\u00e9unies\u00a0:<\/p>\n<ol>\n<li>le corpus d\u2019o\u00f9 sont extraites les donn\u00e9es chiffr\u00e9es doit \u00eatre h\u00e9t\u00e9rog\u00e8ne et ne pas ob\u00e9ir \u00e0 un ordre logique pr\u00e9d\u00e9termin\u00e9\u00a0;<\/li>\n<li>ce corpus ne doit pas \u00eatre concentr\u00e9 autour d\u2019une certaine valeur de r\u00e9f\u00e9rence, mais au contraire \u00e9tal\u00e9 sur plusieurs ordres de grandeur<\/li>\n<\/ol>\n<p>En bref, le royaume de Benford est celui des \u00ab\u00a0bric-\u00e0-brac statistiques\u00a0\u00bb\u00a0!<\/p>\n<h3><strong>L\u2019invariance \u00e0 l\u2019\u00e9chelle, m\u00e8re de la loi de Benford<\/strong><\/h3>\n<p>Examinons un \u00ab\u00a0vrai\u00a0\u00bb bric-\u00e0-brac, tel celui plac\u00e9 en t\u00eate de cet article. \u00c0 quoi ressemble-t-il\u00a0? \u00c0 rien, me direz-vous sans doute\u2026 et c\u2019est m\u00eame \u00e0 cela qu\u2019on le reconna\u00eet\u00a0! Grave erreur,\u00a0car un bric-\u00e0-brac ressemble bien \u00e0 quelque chose\u00a0: il est semblable \u00e0 toute partie de lui-m\u00eame, c\u2019est un objet auto-similaire, \u00ab\u00a0invariant \u00e0 l\u2019\u00e9chelle\u00a0\u00bb en ce sens que son d\u00e9sordre se r\u00e9p\u00e8te \u00e0 toutes les \u00e9chelles d\u2019observation. Or cette propri\u00e9t\u00e9 fondamentale d\u2019invariance \u00e0 l\u2019\u00e9chelle, tr\u00e8s puissante, donne \u00e0 un apparent bric-\u00e0-brac de donn\u00e9es une forte structure cach\u00e9e, induisant en particulier la loi de Benford.<\/p>\n<p>Formul\u00e9e math\u00e9matiquement, l\u2019invariance \u00e0 l\u2019\u00e9chelle impose une contrainte \u00e0 la fonction de r\u00e9partition des donn\u00e9es au sein d\u2019un corpus : si F(x) d\u00e9signe la proportion de ces donn\u00e9es qui sont inf\u00e9rieures \u00e0 une valeur positive donn\u00e9e x, alors l\u2019invariance \u00e0 l\u2019\u00e9chelle exige que, pour tout facteur multiplicatif k &gt; 0 et pour tout couple (x, y) de valeurs positives telles que y &gt; x, on ait :<\/p>\n<p>F(k.y) \u2013 F(k.x)\u00a0 = F(y) \u2013 F(x)<\/p>\n<p>Autrement dit, un corpus de donn\u00e9es est invariant \u00e0 l\u2019\u00e9chelle si deux intervalles homoth\u00e9tiques l\u2019un de l\u2019autre dans un facteur quelconque ont la m\u00eame masse.<\/p>\n<p>Par un raisonnement du niveau \u00ab\u00a0classe pr\u00e9pa\u00a0\u00bb, on montre que les seules fonctions de r\u00e9partition v\u00e9rifiant la condition d\u2019invariance \u00e0 l\u2019\u00e9chelle rev\u00eatent la forme log-lin\u00e9aire\u00a0:<\/p>\n<p>F(x) = a.lnx + b\u00a0 ,\u00a0\u00a0 a &gt; 0<\/p>\n<p>Supposons que le corpus s\u2019\u00e9tende sur 2N ordres de grandeur du syst\u00e8me d\u00e9cimal, chacun du type [10<img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/variances.eu\/wp-content\/ql-cache\/quicklatex.com-930d9df5e09439d359e01415425d75d8_l3.png\" class=\"ql-img-inline-formula quicklatex-auto-format\" alt=\"&#94;&#123;&#110;&#125;\" title=\"Rendered by QuickLaTeX.com\" height=\"6\" width=\"9\" style=\"vertical-align: 7px;\"\/>,10<img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/variances.eu\/wp-content\/ql-cache\/quicklatex.com-35e0cf06122fed6f26d2b623970690a4_l3.png\" class=\"ql-img-inline-formula quicklatex-auto-format\" alt=\"&#94;&#123;&#110;&#43;&#49;&#125;\" title=\"Rendered by QuickLaTeX.com\" height=\"12\" width=\"27\" style=\"vertical-align: 5px;\"\/>]\u00a0 pour n variant de \u2013N \u00e0 N \u2013 1. La borne inf\u00e9rieure du support de la distribution est ainsi 10<img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/variances.eu\/wp-content\/ql-cache\/quicklatex.com-9639e1727e2d023b9d60d0e9fbfe6741_l3.png\" class=\"ql-img-inline-formula quicklatex-auto-format\" alt=\"&#94;&#123;&#45;&#78;&#125;\" title=\"Rendered by QuickLaTeX.com\" height=\"10\" width=\"23\" style=\"vertical-align: 7px;\"\/> et la borne sup\u00e9rieure, 10<img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/variances.eu\/wp-content\/ql-cache\/quicklatex.com-b2241e4ec5d7d1c6591920a4daff999a_l3.png\" class=\"ql-img-inline-formula quicklatex-auto-format\" alt=\"&#94;&#123;&#78;&#125;\" title=\"Rendered by QuickLaTeX.com\" height=\"10\" width=\"13\" style=\"vertical-align: 7px;\"\/>. La d\u00e9termination des constantes a et b d\u00e9coule des conditions aux limites F(10<img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/variances.eu\/wp-content\/ql-cache\/quicklatex.com-9639e1727e2d023b9d60d0e9fbfe6741_l3.png\" class=\"ql-img-inline-formula quicklatex-auto-format\" alt=\"&#94;&#123;&#45;&#78;&#125;\" title=\"Rendered by QuickLaTeX.com\" height=\"10\" width=\"23\" style=\"vertical-align: 7px;\"\/>) = 0 (aucune donn\u00e9e n\u2019est inf\u00e9rieure \u00e0 10<img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/variances.eu\/wp-content\/ql-cache\/quicklatex.com-9639e1727e2d023b9d60d0e9fbfe6741_l3.png\" class=\"ql-img-inline-formula quicklatex-auto-format\" alt=\"&#94;&#123;&#45;&#78;&#125;\" title=\"Rendered by QuickLaTeX.com\" height=\"10\" width=\"23\" style=\"vertical-align: 7px;\"\/>) et F(10<img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/variances.eu\/wp-content\/ql-cache\/quicklatex.com-b2241e4ec5d7d1c6591920a4daff999a_l3.png\" class=\"ql-img-inline-formula quicklatex-auto-format\" alt=\"&#94;&#123;&#78;&#125;\" title=\"Rendered by QuickLaTeX.com\" height=\"10\" width=\"13\" style=\"vertical-align: 7px;\"\/>) = 1 (aucune donn\u00e9e du corpus n\u2019est sup\u00e9rieure \u00e0 10<img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/variances.eu\/wp-content\/ql-cache\/quicklatex.com-b2241e4ec5d7d1c6591920a4daff999a_l3.png\" class=\"ql-img-inline-formula quicklatex-auto-format\" alt=\"&#94;&#123;&#78;&#125;\" title=\"Rendered by QuickLaTeX.com\" height=\"10\" width=\"13\" style=\"vertical-align: 7px;\"\/>). D\u2019o\u00f9\u00a0:<\/p>\n<p>F(x) = 1\/2 + (1\/2N).log<img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/variances.eu\/wp-content\/ql-cache\/quicklatex.com-b439879ad154070b66792558f7190ce6_l3.png\" class=\"ql-img-inline-formula quicklatex-auto-format\" alt=\"&#95;&#123;&#49;&#48;&#125;\" title=\"Rendered by QuickLaTeX.com\" height=\"10\" width=\"13\" style=\"vertical-align: -3px;\"\/>\u00a0x\u00a0\u00a0\u00a0\u00a0\u00a0 ,\u00a0\u00a0\u00a0 10<img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/variances.eu\/wp-content\/ql-cache\/quicklatex.com-9639e1727e2d023b9d60d0e9fbfe6741_l3.png\" class=\"ql-img-inline-formula quicklatex-auto-format\" alt=\"&#94;&#123;&#45;&#78;&#125;\" title=\"Rendered by QuickLaTeX.com\" height=\"10\" width=\"23\" style=\"vertical-align: 7px;\"\/> <img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/variances.eu\/wp-content\/ql-cache\/quicklatex.com-38487a95fa67050b6411ee015dbcb062_l3.png\" class=\"ql-img-inline-formula quicklatex-auto-format\" alt=\"&#92;&#108;&#101;&#113;\" title=\"Rendered by QuickLaTeX.com\" height=\"15\" width=\"12\" style=\"vertical-align: -3px;\"\/> x\u00a0 <img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/variances.eu\/wp-content\/ql-cache\/quicklatex.com-38487a95fa67050b6411ee015dbcb062_l3.png\" class=\"ql-img-inline-formula quicklatex-auto-format\" alt=\"&#92;&#108;&#101;&#113;\" title=\"Rendered by QuickLaTeX.com\" height=\"15\" width=\"12\" style=\"vertical-align: -3px;\"\/> 10<img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/variances.eu\/wp-content\/ql-cache\/quicklatex.com-b2241e4ec5d7d1c6591920a4daff999a_l3.png\" class=\"ql-img-inline-formula quicklatex-auto-format\" alt=\"&#94;&#123;&#78;&#125;\" title=\"Rendered by QuickLaTeX.com\" height=\"10\" width=\"13\" style=\"vertical-align: 7px;\"\/><\/p>\n<p>Autrement dit, le logarithme en base 10 des donn\u00e9es suit une loi uniforme de densit\u00e9 1\/2N sur l\u2019intervalle [\u2013N, N]. Pour cette raison, on dit que la distribution des donn\u00e9es au sein d\u2019un corpus invariant \u00e0 l\u2019\u00e9chelle est \u00ab\u00a0log-uniforme\u00a0\u00bb (\u00e0 ne pas confondre avec log-normale).<\/p>\n<p>On remarque que la m\u00e9diane de la distribution log-uniforme est 1, soit F(1) = 1\/2, les N ordres de grandeur inf\u00e9rieurs \u00e0 l\u2019unit\u00e9 (n = \u2013N, \u2013N+1, \u2026, \u20131) pesant autant que les N ordres de grandeur sup\u00e9rieurs (n = 0, 1, \u2026, N\u20131).<\/p>\n<p>Par ailleurs, invariance \u00e0 l\u2019\u00e9chelle oblige, les diff\u00e9rents ordres de grandeur ont la m\u00eame masse 1\/2N. En outre, au sein de chacun d\u2019eux, la distribution des donn\u00e9es est log-uniforme, tout comme elle l\u2019est pour l\u2019ensemble du corpus. En effet, la fonction de r\u00e9partition F<img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/variances.eu\/wp-content\/ql-cache\/quicklatex.com-7785058273d4245cee0888ba231c85f4_l3.png\" class=\"ql-img-inline-formula quicklatex-auto-format\" alt=\"&#95;&#123;&#110;&#125;\" title=\"Rendered by QuickLaTeX.com\" height=\"6\" width=\"9\" style=\"vertical-align: -3px;\"\/>(x), restreinte \u00a0au n<img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/variances.eu\/wp-content\/ql-cache\/quicklatex.com-dd3406da8d2a6cf70cf1188b48eac694_l3.png\" class=\"ql-img-inline-formula quicklatex-auto-format\" alt=\"&#94;&#123;&egrave;&#109;&#101;&#125;\" title=\"Rendered by QuickLaTeX.com\" height=\"10\" width=\"27\" style=\"vertical-align: 7px;\"\/>\u00a0ordre de grandeur,\u00a0 s\u2019\u00e9crit :<\/p>\n<p>F<img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/variances.eu\/wp-content\/ql-cache\/quicklatex.com-7785058273d4245cee0888ba231c85f4_l3.png\" class=\"ql-img-inline-formula quicklatex-auto-format\" alt=\"&#95;&#123;&#110;&#125;\" title=\"Rendered by QuickLaTeX.com\" height=\"6\" width=\"9\" style=\"vertical-align: -3px;\"\/>(x) = [F(x) \u2013 F(10<img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/variances.eu\/wp-content\/ql-cache\/quicklatex.com-930d9df5e09439d359e01415425d75d8_l3.png\" class=\"ql-img-inline-formula quicklatex-auto-format\" alt=\"&#94;&#123;&#110;&#125;\" title=\"Rendered by QuickLaTeX.com\" height=\"6\" width=\"9\" style=\"vertical-align: 7px;\"\/>) ]\/[ F(10<img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/variances.eu\/wp-content\/ql-cache\/quicklatex.com-35e0cf06122fed6f26d2b623970690a4_l3.png\" class=\"ql-img-inline-formula quicklatex-auto-format\" alt=\"&#94;&#123;&#110;&#43;&#49;&#125;\" title=\"Rendered by QuickLaTeX.com\" height=\"12\" width=\"27\" style=\"vertical-align: 5px;\"\/>) \u2013 F(10<img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/variances.eu\/wp-content\/ql-cache\/quicklatex.com-930d9df5e09439d359e01415425d75d8_l3.png\" class=\"ql-img-inline-formula quicklatex-auto-format\" alt=\"&#94;&#123;&#110;&#125;\" title=\"Rendered by QuickLaTeX.com\" height=\"6\" width=\"9\" style=\"vertical-align: 7px;\"\/>)] = log<img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/variances.eu\/wp-content\/ql-cache\/quicklatex.com-b439879ad154070b66792558f7190ce6_l3.png\" class=\"ql-img-inline-formula quicklatex-auto-format\" alt=\"&#95;&#123;&#49;&#48;&#125;\" title=\"Rendered by QuickLaTeX.com\" height=\"10\" width=\"13\" style=\"vertical-align: -3px;\"\/>x \u2013 n\u00a0 ,\u00a0 10<img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/variances.eu\/wp-content\/ql-cache\/quicklatex.com-930d9df5e09439d359e01415425d75d8_l3.png\" class=\"ql-img-inline-formula quicklatex-auto-format\" alt=\"&#94;&#123;&#110;&#125;\" title=\"Rendered by QuickLaTeX.com\" height=\"6\" width=\"9\" style=\"vertical-align: 7px;\"\/> <img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/variances.eu\/wp-content\/ql-cache\/quicklatex.com-38487a95fa67050b6411ee015dbcb062_l3.png\" class=\"ql-img-inline-formula quicklatex-auto-format\" alt=\"&#92;&#108;&#101;&#113;\" title=\"Rendered by QuickLaTeX.com\" height=\"15\" width=\"12\" style=\"vertical-align: -3px;\"\/> x &lt; 10<img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/variances.eu\/wp-content\/ql-cache\/quicklatex.com-35e0cf06122fed6f26d2b623970690a4_l3.png\" class=\"ql-img-inline-formula quicklatex-auto-format\" alt=\"&#94;&#123;&#110;&#43;&#49;&#125;\" title=\"Rendered by QuickLaTeX.com\" height=\"12\" width=\"27\" style=\"vertical-align: 5px;\"\/><\/p>\n<p>Cette relation implique que la partie fractionnaire (ou mantisse) du logarithme des donn\u00e9es est uniform\u00e9ment distribu\u00e9e entre 0 et 1, pour chacun des ordres de grandeurs. Ceux-ci apparaissent ainsi comme des copies conformes les uns des autres, autant de r\u00e9ductions pantographiques du corpus global. <em>Mutatis mutandis<\/em>, l\u2019invariance \u00e0 l\u2019\u00e9chelle est \u00e0 la statistique ce que la texture fractale [3] est \u00e0 la g\u00e9om\u00e9trie, \u00e0 savoir la propri\u00e9t\u00e9 d\u2019un objet renfermant des miniaturisations de lui-m\u00eame.<\/p>\n<p>Venons en maintenant \u00e0 notre principal point d\u2019int\u00e9r\u00eat\u00a0: quelle est la probabilit\u00e9 Proba(p) que le premier chiffre significatif d\u2019une donn\u00e9e issue d\u2019un corpus invariant \u00e0 l\u2019\u00e9chelle soit le chiffre p (p = 1, 2, \u2026, 9)\u00a0? En balayant les ordres de grandeur du plus petit au plus grand, on obtient\u00a0:<\/p>\n<p>Proba(p) = <img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/variances.eu\/wp-content\/ql-cache\/quicklatex.com-0d4be61ea4449cf794058b52713e63f2_l3.png\" class=\"ql-img-inline-formula quicklatex-auto-format\" alt=\"&#92;&#83;&#105;&#103;&#109;&#97;&#123;&#95;&#123;&#110;&#61;&#45;&#78;&#125;&#125;&#94;&#123;&#78;&#45;&#49;&#125;\" title=\"Rendered by QuickLaTeX.com\" height=\"20\" width=\"89\" style=\"vertical-align: -3px;\"\/> {F[(p+1).10<img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/variances.eu\/wp-content\/ql-cache\/quicklatex.com-35e0cf06122fed6f26d2b623970690a4_l3.png\" class=\"ql-img-inline-formula quicklatex-auto-format\" alt=\"&#94;&#123;&#110;&#43;&#49;&#125;\" title=\"Rendered by QuickLaTeX.com\" height=\"12\" width=\"27\" style=\"vertical-align: 5px;\"\/>] \u2013 F[p.10<img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/variances.eu\/wp-content\/ql-cache\/quicklatex.com-930d9df5e09439d359e01415425d75d8_l3.png\" class=\"ql-img-inline-formula quicklatex-auto-format\" alt=\"&#94;&#123;&#110;&#125;\" title=\"Rendered by QuickLaTeX.com\" height=\"6\" width=\"9\" style=\"vertical-align: 7px;\"\/>]}<\/p>\n<p>Proba(p) = 2N.(1\/2N).[ log<img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/variances.eu\/wp-content\/ql-cache\/quicklatex.com-b439879ad154070b66792558f7190ce6_l3.png\" class=\"ql-img-inline-formula quicklatex-auto-format\" alt=\"&#95;&#123;&#49;&#48;&#125;\" title=\"Rendered by QuickLaTeX.com\" height=\"10\" width=\"13\" style=\"vertical-align: -3px;\"\/>(p +1) \u2013 log<img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/variances.eu\/wp-content\/ql-cache\/quicklatex.com-b439879ad154070b66792558f7190ce6_l3.png\" class=\"ql-img-inline-formula quicklatex-auto-format\" alt=\"&#95;&#123;&#49;&#48;&#125;\" title=\"Rendered by QuickLaTeX.com\" height=\"10\" width=\"13\" style=\"vertical-align: -3px;\"\/> p] = log<img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/variances.eu\/wp-content\/ql-cache\/quicklatex.com-b439879ad154070b66792558f7190ce6_l3.png\" class=\"ql-img-inline-formula quicklatex-auto-format\" alt=\"&#95;&#123;&#49;&#48;&#125;\" title=\"Rendered by QuickLaTeX.com\" height=\"10\" width=\"13\" style=\"vertical-align: -3px;\"\/>(1 +1\/p)<\/p>\n<p>Or cette expression n\u2019est autre que la loi de Benford, qui appara\u00eet ainsi comme une cons\u00e9quence directe de l\u2019invariance \u00e0 l\u2019\u00e9chelle.<\/p>\n<h3><strong>Une cartographie des corpus statistiques<\/strong><\/h3>\n<p>Dans un essai intitul\u00e9 <em>Le hasard sauvage<\/em>, le philosophe Nassim Nicholas Taleb [4] imagine un continent de la statistique s\u00e9par\u00e9 en deux contr\u00e9es\u00a0: d\u2019un c\u00f4t\u00e9, le <em>Mediocristan<\/em>, o\u00f9 r\u00e9sident les donn\u00e9es prisonni\u00e8res d\u2019un certain ordre de grandeur et convenablement d\u00e9crites par leur moyenne (medio) et leur \u00e9cart-type autour de cette moyenne\u00a0; d\u2019un autre c\u00f4t\u00e9, l\u2019<em>Extr<\/em><em>\u00e9mistan<\/em>, o\u00f9 r\u00e9sident les donn\u00e9es s\u2019\u00e9tendant sur plusieurs ordres de grandeur et pour lesquelles seule la m\u00e9diane est un indicateur pertinent, la moyenne \u00e9tant tir\u00e9e vers l\u2019infini sous le poids des valeurs extr\u00eames, selon l\u2019effet dit de longue tra\u00eene.<\/p>\n<p>Les corpus de donn\u00e9es invariants \u00e0 l\u2019\u00e9chelle constituent quant \u00e0 eux une province de l\u2019Extr\u00e9mistan, que nous pourrions nommer Similistan en raison de la propri\u00e9t\u00e9 d\u2019autosimilarit\u00e9. La loi de Benford est une propri\u00e9t\u00e9 intrins\u00e8que des corpus du Similistan. Elle demeure toutefois approximativement valable pour des corpus situ\u00e9s dans la r\u00e9gion du Mediocristan frontali\u00e8re du Similistan. En effet, lorsque qu\u2019une loi log-normale, cloche typique dans le paysage du Mediocristan, est tr\u00e8s \u00e9tal\u00e9e autour de sa moyenne, elle est alors, sur de nombreux ordres de grandeur, proche d\u2019une loi log-uniforme.<\/p>\n<p>Le premier \u00e0 avoir perc\u00e9 rigoureusement le myst\u00e8re de la loi de Benford, en 1995, Hill [5], a toutefois quelque peu brouill\u00e9 les fronti\u00e8res de Taleb, en d\u00e9montrant qu\u2019une concat\u00e9nation d\u2019\u00e9chantillons de donn\u00e9es, chacun d\u2019eux \u00e9tant r\u00e9gi par une loi statistique sp\u00e9cifique et non log-uniforme, engendre un corpus global \u00e0 peu pr\u00e8s invariant \u00e0 l\u2019\u00e9chelle, c\u2019est-\u00e0-dire ob\u00e9issant approximativement \u00e0 la loi log-uniforme.<\/p>\n<h3><strong>Quelques r\u00e9sultats compl\u00e9mentaires<\/strong><\/h3>\n<p><em>La moyenne en fuite<\/em><\/p>\n<p>Puisque, dans un corpus invariant \u00e0 l\u2019\u00e9chelle, les ordres de grandeur successifs, rang\u00e9s dans le sens croissant, ont une m\u00eame masse alors qu\u2019ils sont de plus en plus \u00e9tendus, il en r\u00e9sulte que la densit\u00e9 F\u2019(x) des donn\u00e9es est une fonction homographiquement d\u00e9croissante le long de la demi-droite des nombre r\u00e9els positifs, soit\u00a0:<\/p>\n<p>F\u2019(x) =(1\/2N.ln10).(1\/x)<\/p>\n<p>En calculant, \u00e0 l\u2019aide de cette densit\u00e9, la moyenne <img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/variances.eu\/wp-content\/ql-cache\/quicklatex.com-428ae13d818a324bc299f9767edbb445_l3.png\" class=\"ql-img-inline-formula quicklatex-auto-format\" alt=\"&#92;&#109;&#117;\" title=\"Rendered by QuickLaTeX.com\" height=\"12\" width=\"11\" style=\"vertical-align: -4px;\"\/> et le coefficient de variation CV (ratio rapportant l\u2019\u00e9cart-type <img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/variances.eu\/wp-content\/ql-cache\/quicklatex.com-f7dffde7944f19338f67d56d38c577c4_l3.png\" class=\"ql-img-inline-formula quicklatex-auto-format\" alt=\"&#92;&#115;&#105;&#103;&#109;&#97;\" title=\"Rendered by QuickLaTeX.com\" height=\"8\" width=\"11\" style=\"vertical-align: 0px;\"\/> \u00e0 la moyenne <img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/variances.eu\/wp-content\/ql-cache\/quicklatex.com-428ae13d818a324bc299f9767edbb445_l3.png\" class=\"ql-img-inline-formula quicklatex-auto-format\" alt=\"&#92;&#109;&#117;\" title=\"Rendered by QuickLaTeX.com\" height=\"12\" width=\"11\" style=\"vertical-align: -4px;\"\/>) de la loi log-uniforme sur le support [10<img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/variances.eu\/wp-content\/ql-cache\/quicklatex.com-9639e1727e2d023b9d60d0e9fbfe6741_l3.png\" class=\"ql-img-inline-formula quicklatex-auto-format\" alt=\"&#94;&#123;&#45;&#78;&#125;\" title=\"Rendered by QuickLaTeX.com\" height=\"10\" width=\"23\" style=\"vertical-align: 7px;\"\/>, 10<img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/variances.eu\/wp-content\/ql-cache\/quicklatex.com-b2241e4ec5d7d1c6591920a4daff999a_l3.png\" class=\"ql-img-inline-formula quicklatex-auto-format\" alt=\"&#94;&#123;&#78;&#125;\" title=\"Rendered by QuickLaTeX.com\" height=\"10\" width=\"13\" style=\"vertical-align: 7px;\"\/>], on obtient ais\u00e9ment :<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/variances.eu\/wp-content\/ql-cache\/quicklatex.com-428ae13d818a324bc299f9767edbb445_l3.png\" class=\"ql-img-inline-formula quicklatex-auto-format\" alt=\"&#92;&#109;&#117;\" title=\"Rendered by QuickLaTeX.com\" height=\"12\" width=\"11\" style=\"vertical-align: -4px;\"\/> = (10<img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/variances.eu\/wp-content\/ql-cache\/quicklatex.com-b2241e4ec5d7d1c6591920a4daff999a_l3.png\" class=\"ql-img-inline-formula quicklatex-auto-format\" alt=\"&#94;&#123;&#78;&#125;\" title=\"Rendered by QuickLaTeX.com\" height=\"10\" width=\"13\" style=\"vertical-align: 7px;\"\/> \u2013 10<img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/variances.eu\/wp-content\/ql-cache\/quicklatex.com-9639e1727e2d023b9d60d0e9fbfe6741_l3.png\" class=\"ql-img-inline-formula quicklatex-auto-format\" alt=\"&#94;&#123;&#45;&#78;&#125;\" title=\"Rendered by QuickLaTeX.com\" height=\"10\" width=\"23\" style=\"vertical-align: 7px;\"\/>)\/2N.ln10\u00a0\u00a0\u00a0 CV = <img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/variances.eu\/wp-content\/ql-cache\/quicklatex.com-f7dffde7944f19338f67d56d38c577c4_l3.png\" class=\"ql-img-inline-formula quicklatex-auto-format\" alt=\"&#92;&#115;&#105;&#103;&#109;&#97;\" title=\"Rendered by QuickLaTeX.com\" height=\"8\" width=\"11\" style=\"vertical-align: 0px;\"\/>\/<img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/variances.eu\/wp-content\/ql-cache\/quicklatex.com-428ae13d818a324bc299f9767edbb445_l3.png\" class=\"ql-img-inline-formula quicklatex-auto-format\" alt=\"&#92;&#109;&#117;\" title=\"Rendered by QuickLaTeX.com\" height=\"12\" width=\"11\" style=\"vertical-align: -4px;\"\/> = {N.[(10<img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/variances.eu\/wp-content\/ql-cache\/quicklatex.com-b2241e4ec5d7d1c6591920a4daff999a_l3.png\" class=\"ql-img-inline-formula quicklatex-auto-format\" alt=\"&#94;&#123;&#78;&#125;\" title=\"Rendered by QuickLaTeX.com\" height=\"10\" width=\"13\" style=\"vertical-align: 7px;\"\/> + 10<img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/variances.eu\/wp-content\/ql-cache\/quicklatex.com-9639e1727e2d023b9d60d0e9fbfe6741_l3.png\" class=\"ql-img-inline-formula quicklatex-auto-format\" alt=\"&#94;&#123;&#45;&#78;&#125;\" title=\"Rendered by QuickLaTeX.com\" height=\"10\" width=\"23\" style=\"vertical-align: 7px;\"\/>)\/ (10<img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/variances.eu\/wp-content\/ql-cache\/quicklatex.com-b2241e4ec5d7d1c6591920a4daff999a_l3.png\" class=\"ql-img-inline-formula quicklatex-auto-format\" alt=\"&#94;&#123;&#78;&#125;\" title=\"Rendered by QuickLaTeX.com\" height=\"10\" width=\"13\" style=\"vertical-align: 7px;\"\/> \u2013 10<img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/variances.eu\/wp-content\/ql-cache\/quicklatex.com-9639e1727e2d023b9d60d0e9fbfe6741_l3.png\" class=\"ql-img-inline-formula quicklatex-auto-format\" alt=\"&#94;&#123;&#45;&#78;&#125;\" title=\"Rendered by QuickLaTeX.com\" height=\"10\" width=\"23\" style=\"vertical-align: 7px;\"\/>)].ln10}<img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/variances.eu\/wp-content\/ql-cache\/quicklatex.com-bc5b21fea5fc1e0babb021d2807a3fee_l3.png\" class=\"ql-img-inline-formula quicklatex-auto-format\" alt=\"&#94;&#123;&#49;&#47;&#50;&#125;\" title=\"Rendered by QuickLaTeX.com\" height=\"15\" width=\"20\" style=\"vertical-align: 3px;\"\/><\/p>\n<p>Ainsi, lorsque le corpus s\u2019\u00e9tale, c\u2019est-\u00e0-dire lorsque le nombre N des ordres de grandeur s\u2019accro\u00eet ind\u00e9finiment, la moyenne des donn\u00e9es \u00ab fuit \u00bb vers l\u2019avant proportionnellement \u00e0 10<img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/variances.eu\/wp-content\/ql-cache\/quicklatex.com-b2241e4ec5d7d1c6591920a4daff999a_l3.png\" class=\"ql-img-inline-formula quicklatex-auto-format\" alt=\"&#94;&#123;&#78;&#125;\" title=\"Rendered by QuickLaTeX.com\" height=\"10\" width=\"13\" style=\"vertical-align: 7px;\"\/>\/N tandis que le coefficient de variation diverge comme N<img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/variances.eu\/wp-content\/ql-cache\/quicklatex.com-bc5b21fea5fc1e0babb021d2807a3fee_l3.png\" class=\"ql-img-inline-formula quicklatex-auto-format\" alt=\"&#94;&#123;&#49;&#47;&#50;&#125;\" title=\"Rendered by QuickLaTeX.com\" height=\"15\" width=\"20\" style=\"vertical-align: 3px;\"\/><sup>\u00a0<\/sup>, ce qui manifeste l\u2019effet de longue tra\u00eene propre \u00e0 l\u2019Extr\u00e9mistan.<\/p>\n<p><em>Observation d\u2019un ph\u00e9nom\u00e8ne exponentiel<\/em><\/p>\n<p>Il existe de nombreux corpus de donn\u00e9es <em>Benford by design<\/em>, \u00e0 savoir tous ceux issus de l\u2019observation d\u2019un ph\u00e9nom\u00e8ne dynamique caract\u00e9ris\u00e9 par la croissance exponentielle d\u2019une certaine grandeur. Soit en effet r le taux de croissance constant de cette grandeur et [\u2013T, T], la p\u00e9riode d\u2019observation. La valeur \u00e0 l\u2019instant t = 0 \u00e9tant prise pour unit\u00e9 de mesure, la loi d\u2019\u00e9volution a pour expression\u00a0:<\/p>\n<p>x(t) = exp(r.t)\u00a0 ,\u00a0 \u2013T \u2264 t \u2264 T<\/p>\n<p>Si l\u2019on \u00e9chantillonne le ph\u00e9nom\u00e8ne \u00e0 des instants uniform\u00e9ment r\u00e9partis sur l\u2019intervalle [\u2013T, T], on obtient un corpus de donn\u00e9es dont la fonction de r\u00e9partition s\u2019\u00e9crit\u00a0:<\/p>\n<p>F(x) = Proba[x(t) \u2264 x] = Proba[\u2013T \u2264 t \u2264 (1\/r).ln x] = 1\/2 + (1\/r.T).lnx<\/p>\n<p>On reconna\u00eet ici la loi log-uniforme d\u00e9finie sur 2N ordres de grandeur, o\u00f9 N <img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/variances.eu\/wp-content\/ql-cache\/quicklatex.com-9b76ad66fe9250758fdd9582afccfec5_l3.png\" class=\"ql-img-inline-formula quicklatex-auto-format\" alt=\"&#92;&#97;&#112;&#112;&#114;&#111;&#120;\" title=\"Rendered by QuickLaTeX.com\" height=\"8\" width=\"13\" style=\"vertical-align: 1px;\"\/> r.T\/2ln10<\/p>\n<p>Cette propri\u00e9t\u00e9 est tr\u00e8s importante, car les s\u00e9ries temporelles engendr\u00e9es par une variable dont le taux de croissance est approximativement constant sur un tr\u00e8s large intervalle de temps, sont tr\u00e8s courantes dans l\u2019\u00e9tude des ph\u00e9nom\u00e8nes physiques ou \u00e9conomiques.<\/p>\n<p><em>Invariance \u00e0 <\/em><em>la base de num<\/em><em>\u00e9ration<\/em><\/p>\n<p>La loi de Benford est valide dans un syst\u00e8me de num\u00e9ration de base b quelconque. Supposons en effet que les donn\u00e9es d\u2019un corpus invariant \u00e0 l\u2019\u00e9chelle soient \u00e9crites dans un syst\u00e8me num\u00e9ral de base b quelconque. Les ordres de grandeurs sont alors red\u00e9finis comme les intervalles successifs [b<img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/variances.eu\/wp-content\/ql-cache\/quicklatex.com-930d9df5e09439d359e01415425d75d8_l3.png\" class=\"ql-img-inline-formula quicklatex-auto-format\" alt=\"&#94;&#123;&#110;&#125;\" title=\"Rendered by QuickLaTeX.com\" height=\"6\" width=\"9\" style=\"vertical-align: 7px;\"\/>, b<img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/variances.eu\/wp-content\/ql-cache\/quicklatex.com-35e0cf06122fed6f26d2b623970690a4_l3.png\" class=\"ql-img-inline-formula quicklatex-auto-format\" alt=\"&#94;&#123;&#110;&#43;&#49;&#125;\" title=\"Rendered by QuickLaTeX.com\" height=\"12\" width=\"27\" style=\"vertical-align: 5px;\"\/>]. Par le m\u00eame fil de raisonnement que celui suivi pour la base 10, on obtient la loi du premier chiffre significatif (ou symbole significatif si b &gt; 10), soit\u00a0:<\/p>\n<p>P(p)= log<img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/variances.eu\/wp-content\/ql-cache\/quicklatex.com-fb39f970e2bc7a58d78c1d8e1beec6de_l3.png\" class=\"ql-img-inline-formula quicklatex-auto-format\" alt=\"&#95;&#123;&#98;&#125;\" title=\"Rendered by QuickLaTeX.com\" height=\"10\" width=\"7\" style=\"vertical-align: -3px;\"\/>(1 + 1\/p)\u00a0 ,\u00a0 p = 1, 2, \u2026b \u2013 1<\/p>\n<p>En \u00e9criture binaire, on obtient en particulier P(1) = log<img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/variances.eu\/wp-content\/ql-cache\/quicklatex.com-5734b6408942492f51e1a908125b5328_l3.png\" class=\"ql-img-inline-formula quicklatex-auto-format\" alt=\"&#95;&#123;&#50;&#125;\" title=\"Rendered by QuickLaTeX.com\" height=\"10\" width=\"7\" style=\"vertical-align: -3px;\"\/> (1 + 1) = log<img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/variances.eu\/wp-content\/ql-cache\/quicklatex.com-5734b6408942492f51e1a908125b5328_l3.png\" class=\"ql-img-inline-formula quicklatex-auto-format\" alt=\"&#95;&#123;&#50;&#125;\" title=\"Rendered by QuickLaTeX.com\" height=\"10\" width=\"7\" style=\"vertical-align: -3px;\"\/>\u00a02 = 1, ce qui n\u2019est gu\u00e8re \u00e9tonnant puisque 1 est alors le seul chiffre significatif possible\u00a0! Hill [6] a prouv\u00e9 que la propri\u00e9t\u00e9 d\u2019invariance \u00e0 la base suffit seule \u00e0 caract\u00e9riser la loi de Benford.<\/p>\n<p><em>Chiffres significatifs au-del\u00e0 du premier<\/em><\/p>\n<p>Les travaux de Benford ont \u00e9t\u00e9 g\u00e9n\u00e9ralis\u00e9s, afin de d\u00e9terminer les lois r\u00e9gissant l\u2019occurrence d\u2019un chiffre donn\u00e9 comme m<img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/variances.eu\/wp-content\/ql-cache\/quicklatex.com-dd3406da8d2a6cf70cf1188b48eac694_l3.png\" class=\"ql-img-inline-formula quicklatex-auto-format\" alt=\"&#94;&#123;&egrave;&#109;&#101;&#125;\" title=\"Rendered by QuickLaTeX.com\" height=\"10\" width=\"27\" style=\"vertical-align: 7px;\"\/>\u00a0chiffre significatif. Il appara\u00eet que plus le rang m est \u00e9lev\u00e9, plus la distribution du chiffre significatif figurant \u00e0 ce rang se rapproche de la distribution uniforme, avec une l\u00e9g\u00e8re \u00ab\u00a0pr\u00e9f\u00e9rence\u00a0\u00bb persistante au deuxi\u00e8me rang pour l\u2019occurrence des plus petits chiffres\u00a0; pr\u00e9f\u00e9rence qui s\u2019\u00e9vanouit toutefois d\u00e8s le troisi\u00e8me rang, \u00e0 partir duquel le \u00ab\u00a0hasard\u00a0\u00bb uniforme, sans structure, sans odeur ni saveur, reprend en d\u00e9finitive ses droits\u00a0!<\/p>\n<h3><strong>\u00c0 quoi Benford sert-il\u00a0<\/strong><strong>?<\/strong><\/h3>\n<p>La loi de Benford a-t-elle des applications pratiques ? La r\u00e9ponse est oui\u00a0! Cette loi est en effet pr\u00e9cieuse \u2013 et effectivement utilis\u00e9e\u00a0! \u2013 pour d\u00e9tecter la fraude fiscale, ou le trucage d\u2019une comptabilit\u00e9, ou encore la malhonn\u00eatet\u00e9 scientifique. L\u2019id\u00e9e est on ne peut plus simple\u00a0: si l\u2019on falsifie un corpus de donn\u00e9es, alors on d\u00e9forme artificiellement sa structure statistique, ce qui a pour effet une d\u00e9viation aux lois log-uniforme et de Benford. Donc, si un v\u00e9rificateur automatique constate une telle d\u00e9viation, de deux choses l\u2019une\u00a0: ou bien la cause de l\u2019\u00e9cart est clairement identifiable et provient de la nature particuli\u00e8re des donn\u00e9es ; ou bien, l\u2019\u00e9cart est injustifiable de cette mani\u00e8re, les donn\u00e9es devraient th\u00e9oriquement suivre approximativement la loi de Benford, et dans ce cas la suspicion de fraude est forte, un audit approfondi s\u2019impose\u00a0!<\/p>\n<p>&nbsp;<\/p>\n<p><em>Mots-cl<\/em><em>\u00e9s<\/em><em> : Loi de Benford &#8211; biais cognitif d\u2019\u00e9<\/em><em>quiprobabilit<\/em><em>\u00e9 &#8211; <\/em><em>autosimilarit<\/em><em>\u00e9 &#8211; d\u00e9tection des fraudes.<\/em><\/p>\n<hr \/>\n<h3><strong>R\u00e9f\u00e9rences<\/strong><\/h3>\n<p>[1] Newcomb, Simon (1881), Note on the Frequency of Use of the Different Digits in Natural Numbers\u00a0, <em>American Journal of Mathematics<\/em>, 4, pp.39-40.<\/p>\n<p>[2] Benford, Frank (1938) The Law of Anonalous Numbers\u00a0, <em>Proceedings of the American philosophical society<\/em>, 78, pp.551-572.<\/p>\n<p>[3] Mandelbrot, Beno\u00eet (1975), <em>Les objets fractals\u00a0: forme, hasard et dimension<\/em>, Flammarion, 190p..<\/p>\n<p>[4] Taleb, Nassim Nicholas (2009), <em>Le hasard sauvage<\/em>, Les Belles Lettres, 371p.<\/p>\n<p>[5] Hill Theodore P. (1995),\u00a0Statistical Derivation of the Significant Digit Law, <em>Statistical Science<\/em>, 10, pp.354-363.<\/p>\n<p>[6] Hill, Theodore P. (1995), Base-Invariance Implies Benford\u2019s Law\u00a0\u00bb <em>Proceedings of the American mathematical society<\/em>, 123, pp.887-895.<\/p>\n<p>&nbsp;<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Un jeu in\u00e9quitable\u2026 mais pas dans le sens escompt\u00e9\u00a0! Accepteriez-vous de jouer avec moi au jeu suivant\u00a0? Dans la derni\u00e8re \u00e9dition du Wall Street Journal, extrayons \u00ab\u00a0au hasard\u00a0\u00bb mille donn\u00e9es chiffr\u00e9es positives, portant sur les cours de bourse, les taux d\u2019int\u00e9r\u00eat, les taux de change, etc., et ne retenons, pour chaque donn\u00e9e \u00e9l\u00e9mentaire, que son [&hellip;]<\/p>\n","protected":false},"author":229,"featured_media":7102,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_et_pb_use_builder":"","_et_pb_old_content":"","_et_gb_content_width":"","_exactmetrics_skip_tracking":false,"_exactmetrics_sitenote_active":false,"_exactmetrics_sitenote_note":"","_exactmetrics_sitenote_category":0,"footnotes":""},"categories":[18],"tags":[],"class_list":["post-7078","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-statistiques","et-has-post-format-content","et_post_format-et-post-format-standard"],"_links":{"self":[{"href":"https:\/\/variances.eu\/index.php?rest_route=\/wp\/v2\/posts\/7078","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/variances.eu\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/variances.eu\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/variances.eu\/index.php?rest_route=\/wp\/v2\/users\/229"}],"replies":[{"embeddable":true,"href":"https:\/\/variances.eu\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=7078"}],"version-history":[{"count":0,"href":"https:\/\/variances.eu\/index.php?rest_route=\/wp\/v2\/posts\/7078\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/variances.eu\/index.php?rest_route=\/wp\/v2\/media\/7102"}],"wp:attachment":[{"href":"https:\/\/variances.eu\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=7078"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/variances.eu\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=7078"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/variances.eu\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=7078"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}