{"id":5122,"date":"2020-06-22T07:40:34","date_gmt":"2020-06-22T05:40:34","guid":{"rendered":"http:\/\/variances.eu\/?p=5122"},"modified":"2020-06-22T08:01:14","modified_gmt":"2020-06-22T06:01:14","slug":"la-donnee-des-tablettes-sumeriennes-aux-big-data-2","status":"publish","type":"post","link":"https:\/\/variances.eu\/?p=5122","title":{"rendered":"La donn\u00e9e : des tablettes sum\u00e9riennes aux big data"},"content":{"rendered":"<div>\n<p><em><span style=\"color: #0000ff;\">Article initialement publi\u00e9 dans Variances n\u00b053 d&rsquo;octobre 2015, num\u00e9ro d\u00e9di\u00e9 \u00e0 la Conf\u00e9rence \u00ab\u00a0Individus, donn\u00e9es &amp; soci\u00e9t\u00e9 connect\u00e9e\u00a0\u00bb qui s&rsquo;est tenue le 18 juin 2015 au CNAM.<\/span><\/em><\/p>\n<p><em><span style=\"color: #0000ff;\">L&rsquo;auteur, Jean-Jacques Droesbeke, qui est Professeur \u00e9m\u00e9rite de l&rsquo;Universit\u00e9 Libre de Bruxelles, intervenait \u00e0 l&rsquo;occasion de l&rsquo;introduction, et apr\u00e8s les discours d&rsquo;ouverture.<\/span><\/em><\/p>\n<hr \/>\n<\/div>\n<p>L&rsquo;objet de cet article est de pr\u00e9senter les phases principales de l&rsquo;\u00e9volution du concept de donn\u00e9e depuis l&rsquo;Antiquit\u00e9 jusqu&rsquo;\u00e0 nos jours. Le participe pass\u00e9 f\u00e9minin substantiv\u00e9 du verbe donner a d&rsquo;abord eu le sens d&rsquo; \u00ab\u00a0aum\u00f4ne, distribution\u00a0\u00bb (1200). Il s&rsquo;est limit\u00e9 \u00e0 quelques sens sp\u00e9cialis\u00e9s en math\u00e9matiques (1755) et psychologie. On l&rsquo;utilise aussi en informatique et statistique, traduit de l&rsquo;anglais data, pluriel du supin, premi\u00e8re forme, du verbe latin dare, \u00ab donner \u00bb (voir Rey et al., 1993). Dans cette br\u00e8ve pr\u00e9sentation de son histoire, nous distinguerons quatre p\u00e9riodes distinctes.<\/p>\n<h3>De Sumer au 16<sup>\u00e8me<\/sup> si\u00e8cle<span style=\"color: black;\"><br \/>\n<\/span><\/h3>\n<p>Les donn\u00e9es produites pendant cette p\u00e9riode concernent essentiellement deux op\u00e9rations\u00a0: le <em>d\u00e9nombrement<\/em> et l&rsquo;<em>observation de ph\u00e9nom\u00e8nes astronomiques<\/em>.<\/p>\n<p>Le d\u00e9nombrement a toujours \u00e9t\u00e9 une op\u00e9ration importante de l&rsquo;activit\u00e9 humaine. Le recensement des populations en est son expression statistique la plus visible. Les premiers t\u00e9moignages de mise en \u0153uvre de cette m\u00e9thode de collecte de donn\u00e9es sont grav\u00e9s sur des tablettes d&rsquo;argile sum\u00e9riennes et babyloniennes.<\/p>\n<div style=\"width: 409px\" class=\"wp-caption aligncenter\"><img loading=\"lazy\" decoding=\"async\" src=\"http:\/\/variances.eu\/wp-content\/uploads\/2016\/03\/033116_2045_Ladonnedes2.jpg\" alt=\"\" width=\"399\" height=\"296\" \/><p class=\"wp-caption-text\">Figure 1: A l&rsquo;origine<\/p><\/div>\n<p>D\u00e8s le d\u00e9but de son utilisation (Les paragraphes qui suivent sont bas\u00e9s sur le chapitre 2 de l&rsquo;ouvrage de Droesbeke et Vermandele (2016).), le recensement s&rsquo;est av\u00e9r\u00e9 \u00eatre un outil de gestion appr\u00e9ci\u00e9 des puissants. Si les M\u00e9sopotamiens y ont recouru tr\u00e8s t\u00f4t, on en trouve aussi trace dans l&rsquo;Egypte ancienne, d\u00e8s la fin du troisi\u00e8me mill\u00e9naire avant notre \u00e8re. Ces peuples avaient bien saisi l&rsquo;int\u00e9r\u00eat de recenser les populations pour savoir combien d&rsquo;hommes pouvaient participer \u00e0 la construction des temples, palais, pyramides\u2026 ou encore d&rsquo;utiliser cette technique \u00e0 des fins fiscales.<\/p>\n<p>Plus une population est nombreuse, plus le recensement s&rsquo;av\u00e8re utile. C&rsquo;est ce qu&rsquo;avaient compris aussi les empereurs chinois. Quelle que soit l&rsquo;\u00e9poque concern\u00e9e, ceux-ci avaient dot\u00e9 la Chine d&rsquo;une structure administrative consacr\u00e9e \u00e0 ce th\u00e8me, dirig\u00e9e par des <em>directeurs des multitudes<\/em> aux pouvoirs affirm\u00e9s. Pendant plus de 2000 ans, le recensement a constitu\u00e9 un outil au service de l&rsquo;administration chinoise.<\/p>\n<p>L&rsquo;Inde est un autre pays d&rsquo;Asie qui a proc\u00e9d\u00e9 d\u00e8s le 4<sup>\u00e8me<\/sup> si\u00e8cle avant notre \u00e8re au d\u00e9nombrement de sa population. Elle a m\u00eame \u00e9t\u00e9 plus loin que cet objectif fondamental en pr\u00f4nant une politique planificatrice d&rsquo;expansion territoriale et \u00e9conomique bas\u00e9e sur une connaissance approfondie de sa population. Un trait\u00e9 a d\u00e9fini la fa\u00e7on d&rsquo;y parvenir, l&rsquo;<em>Arthasastra<\/em>, r\u00e9dig\u00e9 par Kautilya, ministre de l&#8217;empire indien des Maurya. Il s&rsquo;agit d&rsquo;une m\u00e9thode dont la minutie est remarquable, tant dans la mani\u00e8re de d\u00e9finir les caract\u00e8res de la population prise en compte que de la quantit\u00e9 importante de donn\u00e9es relev\u00e9es (voir Hecht, 1987). On imagine sans difficult\u00e9 que la mise en \u0153uvre de ce type de relev\u00e9 reposait sur un soutien administratif tr\u00e8s dense, encadr\u00e9 par un contr\u00f4le policier explicite qui n&rsquo;incitait pas aux non-r\u00e9ponses.<\/p>\n<p>Cette mani\u00e8re d&rsquo;agir a mis plus de temps pour \u00eatre appliqu\u00e9e en Occident. La civilisation grecque accorda moins d&rsquo;importance \u00e0 la recherche du nombre d&rsquo;habitants qu&rsquo;\u00e0 celui de la composition id\u00e9ale de la Cit\u00e9, ch\u00e8re \u00e0 Platon, m\u00eame si Aristote, dans sa <em>Politique<\/em>, s&rsquo;attarda \u00e0 r\u00e9aliser des travaux de statistique descriptive et comparative. Les Romains reprirent les objectifs originaux\u00a0: r\u00e9aliser des recensements p\u00e9riodiques gr\u00e2ce \u00e0 une structure administrative bien organis\u00e9e afin de contr\u00f4ler et d&rsquo;administrer toutes les composantes de leurs territoires. Initi\u00e9s sous Servius Tullius au 5<sup>\u00e8me<\/sup> si\u00e8cle avant notre \u00e8re et r\u00e9alis\u00e9s jusqu&rsquo;en l&rsquo;an 73 sous Auguste (ann\u00e9e du dernier recensement de l&#8217;empire romain), les d\u00e9nombrements ont fait de la fonction de censeur, comme en Chine, un privil\u00e8ge recherch\u00e9.<\/p>\n<p>La p\u00e9riode du d\u00e9clin de l&rsquo;Empire romain et le Haut Moyen Age n&rsquo;ont pas constitu\u00e9 un terrain fertile pour l&rsquo;organisation de recensements. Ce n&rsquo;est qu&rsquo;entre le 14<sup>\u00e8me<\/sup> et le 16<sup>\u00e8me<\/sup> si\u00e8cle, que l&rsquo;on ressent \u00e0 nouveau le besoin d&rsquo;informations, que ce soit au niveau des r\u00f4les fiscaux ou \u00e0 celui des relev\u00e9s d&rsquo;ordre religieux (Mentionnons en particulier les ordonnances de Villers-Cotter\u00eats de Fran\u00e7ois Ier, en 1539, et celle de Blois de Henri III en 1579, qui introduisirent respectivement les registres de bapt\u00eames et de mariages).<\/p>\n<p>Dans un autre domaine, l&rsquo;astronomie, les Babyloniens ont observ\u00e9 les mouvements du soleil et des plan\u00e8tes \u00e0 intervalles r\u00e9guliers, obtenant ainsi plusieurs observations d&rsquo;un m\u00eame ph\u00e9nom\u00e8ne (voir, par exemple, la tablette d&rsquo;Ammi-\u015eaduqa sur V\u00e9nus<a href=\"https:\/\/fr.wikipedia.org\/wiki\/V%C3%A9nus_%28plan%C3%A8te%29\">,<\/a> pr\u00e9sent\u00e9e dans la figure 2, datant du 17<sup>\u00e8me<\/sup> si\u00e8cle avant notre \u00e8re et visible au British Museum).<\/p>\n<div style=\"width: 329px\" class=\"wp-caption aligncenter\"><img loading=\"lazy\" decoding=\"async\" src=\"http:\/\/variances.eu\/wp-content\/uploads\/2016\/03\/033116_2045_Ladonnedes3.png\" alt=\"\" width=\"319\" height=\"538\" \/><p class=\"wp-caption-text\">Figure 2: Donn\u00e9es v\u00e9nusiennes<\/p><\/div>\n<p>Nous ne connaissons malheureusement pas la mani\u00e8re dont ils ont remplac\u00e9 ces observations multiples par des \u00ab\u00a0valeurs de compromis\u00a0\u00bb. On poss\u00e8de plus d&rsquo;informations sur les travaux ult\u00e9rieurs des astronomes grecs (voir Droesbeke et Saporta, 2010). Ainsi, Ptol\u00e9m\u00e9e, astronome du 2<sup>\u00e8me<\/sup> si\u00e8cle, utilisa les relev\u00e9s ant\u00e9rieurs d&rsquo;Aristarque de Samos et surtout d&rsquo;Hipparque et proposa, en pr\u00e9sence de plusieurs observations d&rsquo;un m\u00eame ph\u00e9nom\u00e8ne, de conserver une seule valeur accompagn\u00e9e de mesures de variation bas\u00e9es, semble-t-il, sur l&rsquo;<em>\u00e9tendue<\/em> des observations, c&rsquo;est-\u00e0-dire l&rsquo;\u00e9cart entre la plus grande et la plus petite d&rsquo;entre elles. Jusqu&rsquo;au 16<sup>\u00e8me<\/sup> si\u00e8cle, on pr\u00e9f\u00e9ra retenir une \u00ab\u00a0bonne valeur\u00a0\u00bb \u2014\u00a0en omettant souvent de justifier l&rsquo;adjectif utilis\u00e9\u00a0\u2014 que recourir \u00e0 une synth\u00e8se syst\u00e9matique. Le premier qui utilisa une moyenne comme \u00ab\u00a0outil de synth\u00e8se\u00a0\u00bb est probablement l&rsquo;astronome Tycho Brah\u00e9 (1546-1601) dont les nombreuses donn\u00e9es sur le mouvement des plan\u00e8tes permirent \u00e0 Johannes Kepler (1571-1630) d&rsquo;\u00e9noncer les lois qui portent son nom.<\/p>\n<p>En cette fin du 16<sup>\u00e8me<\/sup> si\u00e8cle, on construit des donn\u00e9es <em>primaires<\/em> et <em>individuelles<\/em>, semblables \u00e0 celles \u00e9labor\u00e9es dans l&rsquo;Antiquit\u00e9 depuis l&rsquo;apparition de l&rsquo;\u00e9criture. Pour ce qui concerne les donn\u00e9es r\u00e9sultant d&rsquo;observations r\u00e9p\u00e9t\u00e9es d&rsquo;un m\u00eame ph\u00e9nom\u00e8ne, les faibles progr\u00e8s techniques r\u00e9alis\u00e9s dans la recherche d&rsquo;une plus grande pr\u00e9cision des instruments de mesure ont fait croire longtemps qu&rsquo;une \u00ab\u00a0bonne mesure\u00a0\u00bb \u00e9tait meilleure qu&rsquo;une agr\u00e9gation dont on ne soup\u00e7onnait pas l&rsquo;int\u00e9r\u00eat.<\/p>\n<h3>Les 17\u00e8me et 18\u00e8me si\u00e8cles<\/h3>\n<p>Depuis le 15<sup>\u00e8me<\/sup> si\u00e8cle, de nombreuses villes ont recens\u00e9 leurs habitants. Les Etats tendant \u00e0 se centraliser et \u00e0 se doter d&rsquo;une administration solide, le besoin de d\u00e9nombrer se fait \u00e0 nouveau sentir, m\u00eame si la pratique est souvent d\u00e9faillante. Jusqu&rsquo;\u00e0 la fin du 17<sup>\u00e8me<\/sup> si\u00e8cle, les registres sont en effet loin d&rsquo;\u00eatre parfaits\u00a0! Ce 17<sup>\u00e8me<\/sup> si\u00e8cle voit trois courants distincts se d\u00e9velopper en Europe\u00a0: la <em>Staatkunde<\/em> allemande, les <em>enqu\u00eates<\/em> de l&rsquo;administration fran\u00e7aise et l&rsquo;<em>arithm\u00e9tique politique<\/em> anglaise.<\/p>\n<p>La <em>Staatkunde<\/em> allemande trouve ses racines dans les travaux d&rsquo;Aristote. Pour ses d\u00e9fenseurs (parmi lesquels il faut citer le nom d&rsquo;Achenwall (1719-1772) \u00e0 qui on attribue la paternit\u00e9 du mot \u00ab\u00a0<em>statistique<\/em>\u00a0\u00bb), la statistique est la <em>science de l&rsquo;Etat<\/em>. Purement descriptive, elle ne fait pratiquement jamais appel \u00e0 des donn\u00e9es chiffr\u00e9es. Son influence est cependant significative, surtout en Europe centrale, et perdurera jusqu&rsquo;au 19<sup>\u00e8me<\/sup> si\u00e8cle.<\/p>\n<p>En France, on plaide toujours pour les d\u00e9nombrements comme outils de gouvernement. Deux hommes se sont particuli\u00e8rement illustr\u00e9s dans le recours \u00e0 des enqu\u00eates en raison des contraintes \u00e9conomiques\u00a0: Colbert (1619-1683) qui d\u00e9veloppe une strat\u00e9gie de d\u00e9nombrement des villes et des r\u00e9gions, et Vauban (1633-1707), auteur d&rsquo;une <em>M\u00e9thode g\u00e9n\u00e9ralle et facille pour faire le d\u00e9nombrement des peuples<\/em> en 1686.<\/p>\n<p>Mais c&rsquo;est en Angleterre qu&rsquo;un mouvement novateur se r\u00e9pand avec l&rsquo;arithm\u00e9tique politique due principalement \u00e0 Graunt (1620-1674) et Petty (1623-1687). Comme le dira Charles Davenant (1656-1714), \u00e9mule de Petty, \u00ab\u00a0<em>l&rsquo;arithm\u00e9tique politique est l&rsquo;art de raisonner par des chiffres sur des objets relatifs au gouvernement<\/em>\u00a0\u00bb. On y trouve les fondements de la <em>m\u00e9thode du multiplicateur<\/em> qui a marqu\u00e9 les techniques de d\u00e9nombrement des 17<sup>\u00e8me<\/sup> et 18<sup>\u00e8me<\/sup> si\u00e8cles, provoquant une mise \u00e0 l&rsquo;ombre certaine de la <em>Staatkunde<\/em> allemande en Europe occidentale.<\/p>\n<p>La m\u00e9thode du multiplicateur repose sur l&rsquo;id\u00e9e suivante\u00a0: il existe des quantit\u00e9s qui sont en rapports simples et relativement constants avec la population d&rsquo;un pays. Si ces quantit\u00e9s sont plus simples \u00e0 d\u00e9nombrer (nombre de maisons, feux (foyers)\u2026 , ou encore nombre de naissances, de d\u00e9c\u00e8s\u2026 dans l&rsquo;ann\u00e9e), il suffit de multiplier leur nombre par un <em>multiplicateur<\/em> ad\u00e9quat pour obtenir une estimation du nombre d&rsquo;individus dans la population. Pour les responsables politiques de l&rsquo;\u00e9poque, le recensement d&rsquo;une population pr\u00e9sente des d\u00e9savantages certains (r\u00e9actions de m\u00e9fiance des enqu\u00eat\u00e9s, co\u00fbts de mise en \u0153uvre trop \u00e9lev\u00e9s\u2026) ; mais d&rsquo;un autre c\u00f4t\u00e9, le choix d&rsquo;une entit\u00e9 plus simple \u00e0 d\u00e9nombrer et la d\u00e9termination d&rsquo;un multiplicateur unique posent aussi des probl\u00e8mes de fiabilit\u00e9.<\/p>\n<p>Une des caract\u00e9ristiques du 18<sup>\u00e8me<\/sup> si\u00e8cle \u2013\u00a0le si\u00e8cle des Lumi\u00e8res\u00a0\u2013 est le triomphe de l&rsquo;esprit de calcul. Il faut dire que les progr\u00e8s r\u00e9alis\u00e9s par les math\u00e9matiques sont alors consid\u00e9rables et la <em>loi des grands nombres<\/em> de Bernoulli vient ajouter sa pierre \u00e0 l&rsquo;\u00e9difice. L&rsquo;\u00e9poque est cependant marqu\u00e9e par de nombreuses impr\u00e9cisions sur les estimations fournies par les uns et les autres. Il n&rsquo;est donc pas \u00e9tonnant de constater que les recensements sont revenus en force au 19<sup>\u00e8me<\/sup> si\u00e8cle avant de conna\u00eetre une stagnation puis un d\u00e9clin au 20<sup>\u00e8me<\/sup> si\u00e8cle, d\u00fb notamment \u00e0 l&rsquo;introduction de registres administratifs performants et au d\u00e9veloppement des techniques de sondage. Mais cela, c&rsquo;est une autre histoire sur laquelle nous reviendrons ci-dessous.<\/p>\n<p>Parmi les d\u00e9veloppements qui contribuent significativement \u00e0 l&rsquo;\u00e9volution de l&rsquo;histoire des donn\u00e9es, il faut souligner l&rsquo;am\u00e9lioration des instruments de mesure. Celle-ci est essentielle car elle permet aux hommes de s&rsquo;aventurer sur les mers en s&rsquo;assurant une meilleure qualit\u00e9 des moyens de se guider. Par ailleurs, si les mesures astronomiques constituent toujours une mani\u00e8re incontournable \u2014\u00a0malgr\u00e9 leurs impr\u00e9cisions\u00a0\u2014 de savoir o\u00f9 l&rsquo;on se trouve, un autre instrument de connaissance permet de mieux ma\u00eetriser le sol sur lequel on vit\u00a0: la g\u00e9od\u00e9sie. Cette discipline et l&rsquo;astronomie constituent deux domaines privil\u00e9gi\u00e9s d&rsquo;un traitement de donn\u00e9es qui se cherche. Un exemple remarquable est celui de la mesure d&rsquo;un arc de m\u00e9ridien, au centre d&rsquo;une question primordiale \u00e0 l&rsquo;\u00e9poque\u00a0: quelle est la figure de la terre\u00a0? Le recours \u00e0 la technique de triangulation est \u00e0 l&rsquo;origine d&rsquo;aventures multiples de cette mesure dans diverses r\u00e9gions du globe qui permettront de r\u00e9soudre la question (voir Droesbeke et al. , 2016).<\/p>\n<p>Le besoin de mesurer est partag\u00e9 par de nombreux savants qui b\u00e9n\u00e9ficient d&rsquo;instruments de mesure de plus en plus pr\u00e9cis. On devient exigeant \u00e0 propos de la qualit\u00e9 des observations effectu\u00e9es et l&rsquo;erreur de mesure devient un souci essentiel.<\/p>\n<p>Deux approches coexistent pendant de nombreuses ann\u00e9es. La premi\u00e8re milite pour la recherche d&rsquo;une bonne mesure, entach\u00e9e d&rsquo;une erreur limit\u00e9e, inf\u00e9rieure \u00e0 une erreur maximale, acceptable ou en tout cas \u00e0 craindre. Dans cette optique \u2212\u00a0d\u00e9fendue par Leonhard Euler (1707- 1783)\u00a0\u2212 prendre en compte d&rsquo;autres mesures en plus de la bonne ne peut que faire cro\u00eetre l&rsquo;erreur globale, notamment en utilisant les observations les plus mauvaises.<\/p>\n<p>Un deuxi\u00e8me mod\u00e8le nous int\u00e9resse davantage ici. Il repose sur l&rsquo;hypoth\u00e8se que l&rsquo;utilisation de toutes les observations permet des compensations dont on peut esp\u00e9rer qu&rsquo;elles r\u00e9duisent l&rsquo;erreur r\u00e9sultante. C&rsquo;est en recherchant des mod\u00e8les appropri\u00e9s de distribution des erreurs que de nombreux scientifiques contribueront \u00e0 la consolidation d&rsquo;une th\u00e9orie qui sera qualifi\u00e9e en 1765 de <em>th\u00e9orie des erreurs<\/em> par Johann-Heinrich Lambert (1728-1777).<\/p>\n<p>La multiplicit\u00e9 des observations et le besoin de s&rsquo;interroger sur le comportement des <em>erreurs de mesure<\/em> n&rsquo;am\u00e8nent pas seulement de nombreux scientifiques \u00e0 vouloir mod\u00e9liser cette erreur pour mieux la dompter\u00a0; cette question comporte aussi des aspects politiques et commerciaux qui constituent autant d&rsquo;enjeux importants pour l&rsquo;\u00e9poque.<\/p>\n<p>Les donn\u00e9es se multiplient et se contredisent. Il faut en comprendre la raison, les g\u00e9rer pour en tirer profit. Le calcul des probabilit\u00e9s vient en aide \u00e0 ceux qui affrontent ce probl\u00e8me. Il en r\u00e9sulte une cons\u00e9quence \u00e0 trois facettes dont les effets seront durables\u00a0: la <em>loi des erreurs<\/em>, qui sera qualifi\u00e9e de \u00ab\u00a0normale\u00a0\u00bb \u00e0 la fin du 19<sup>\u00e8me<\/sup> si\u00e8cle, devient une loi de r\u00e9f\u00e9rence, la <em>moyenne<\/em> s&rsquo;av\u00e8re \u00eatre le mode de synth\u00e8se privil\u00e9gi\u00e9 et un crit\u00e8re d&rsquo;ajustement devient incontournable\u00a0: le <em>crit\u00e8re des moindres carr\u00e9s<\/em> (voir Droesbeke et Tassi, 2015). Deux hommes jouent un r\u00f4le central dans cette histoire\u00a0: Pierre-Simon de Laplace (1749- 1827) et Carl Friedrich Gauss (1777-1855).<\/p>\n<div style=\"width: 285px\" class=\"wp-caption aligncenter\"><img loading=\"lazy\" decoding=\"async\" src=\"http:\/\/variances.eu\/wp-content\/uploads\/2016\/03\/033116_2045_Ladonnedes4.jpg\" alt=\"\" width=\"275\" height=\"366\" \/><p class=\"wp-caption-text\">Figure 3: Pierre-Simon de Laplace<\/p><\/div>\n<p style=\"text-align: center;\"><span style=\"color: #44546a; font-size: 9pt;\"><em>\u00a0<\/em><\/span><\/p>\n<div style=\"width: 285px\" class=\"wp-caption aligncenter\"><img loading=\"lazy\" decoding=\"async\" src=\"http:\/\/variances.eu\/wp-content\/uploads\/2016\/03\/033116_2045_Ladonnedes5.jpg\" alt=\"\" width=\"275\" height=\"353\" \/><p class=\"wp-caption-text\">Figure 4: Carl-Friedrich Gauss<\/p><\/div>\n<p style=\"text-align: left;\">Les donn\u00e9es individuelles deviennent plus fiables ; elles font place aux donn\u00e9es agr\u00e9g\u00e9es et aux donn\u00e9es transform\u00e9es (voir Droesbeke et Vermandele, 2016).<\/p>\n<h3>Quelques points forts du 19<sup>\u00e8me<\/sup> si\u00e8cle<\/h3>\n<p>Le 19<sup>\u00e8me<\/sup> si\u00e8cle occupe une place tr\u00e8s importante en statistique. S&rsquo;il fallait retenir cinq caract\u00e9ristiques essentielles de ce si\u00e8cle dans l&rsquo;histoire des donn\u00e9es, notre choix serait le suivant :<\/p>\n<ol>\n<li>\n<div>L&rsquo;application des trois outils utilis\u00e9s en astronomie (loi normale, crit\u00e8re des moindres carr\u00e9s et moyenne) \u00e0 l&rsquo;\u00e9tude des populations et de leurs caract\u00e9ristiques humaines, permettant \u00e0 Adolphe Quetelet (1796-1872) de cr\u00e9er une <em>th\u00e9orie des moyennes<\/em> aux accents multiples (voir Acad\u00e9mie Royale de Belgique, 1997, Desrosi\u00e8res, 1993 ou encore Droesbeke et Vermandele, 2016).<\/div>\n<\/li>\n<li>\n<div>Le d\u00e9veloppement de la <em>statistique<\/em> comme outil de gestion des Etats, au niveau \u00e9conomique et social (voir Desrosi\u00e8res, 1993). Les tables statistiques et les repr\u00e9sentations graphiques deviennent un outil important d&rsquo;analyse et de communication.<\/div>\n<\/li>\n<li>\n<div>Le remplacement du r\u00f4le central de la moyenne par celui de la dispersion dans les pr\u00e9occupations des savants de tous bords.<\/div>\n<\/li>\n<li>\n<div>Le d\u00e9placement du centre de gravit\u00e9 de la statistique vers Londres et l&rsquo;\u00e9mergence des concepts de corr\u00e9lation et de r\u00e9gression (voir Droesbeke et Tassi, 2015 et Droesbeke et Vermandele, 2016).<\/div>\n<\/li>\n<li>L&rsquo;\u00e9mergence d&rsquo;une nouvelle m\u00e9thode de recueil des donn\u00e9es\u00a0: les sondages (voir Droesbeke et Tassi, 2015).<\/li>\n<\/ol>\n<p>Les donn\u00e9es individuelles se r\u00e9pandent\u00a0; la mani\u00e8re de les produire se diversifie. Elles deviennent nombreuses\u00a0: il faut les montrer et les r\u00e9sumer.<\/p>\n<h3>Le 20e si\u00e8cle et le d\u00e9but du 21e si\u00e8cle<\/h3>\n<p>Il est difficile de d\u00e9tailler dans cet article les d\u00e9veloppements de la statistique au 20<sup>\u00e8me<\/sup> si\u00e8cle, tant les innovations sont nombreuses et diversifi\u00e9es. Il est certain que l&rsquo;inf\u00e9rence statistique est au centre de ces derni\u00e8res, avec ses deux probl\u00e8mes centraux, l&rsquo;estimation de param\u00e8tres d&rsquo;une population et les tests d&rsquo;hypoth\u00e8ses r\u00e9alis\u00e9s \u00e0 partir d&rsquo;un \u00e9chantillon. La figure 5 nous montre les principaux acteurs et le moment de leur activit\u00e9 la plus intense (en rouge) dans le d\u00e9veloppement de leurs travaux.<\/p>\n<div id=\"attachment_5119\" style=\"width: 840px\" class=\"wp-caption aligncenter\"><img loading=\"lazy\" decoding=\"async\" aria-describedby=\"caption-attachment-5119\" class=\"wp-image-5119 size-full\" src=\"http:\/\/variances.eu\/wp-content\/uploads\/2015\/10\/ImaJJD.jpg\" alt=\"\" width=\"830\" height=\"435\" srcset=\"https:\/\/variances.eu\/wp-content\/uploads\/2015\/10\/ImaJJD.jpg 830w, https:\/\/variances.eu\/wp-content\/uploads\/2015\/10\/ImaJJD-300x157.jpg 300w, https:\/\/variances.eu\/wp-content\/uploads\/2015\/10\/ImaJJD-600x314.jpg 600w\" sizes=\"(max-width: 830px) 100vw, 830px\" \/><p id=\"caption-attachment-5119\" class=\"wp-caption-text\">Figure 5: Les moments forts de l&rsquo;inf\u00e9rence statistique<\/p><\/div>\n<p>Nous ne pouvons expliciter ici toutes les ouvertures nouvelles du 20<sup>\u00e8me<\/sup> si\u00e8cle et du d\u00e9but du si\u00e8cle actuel, qui traitent des donn\u00e9es\u00a0: elles s&rsquo;appellent <em>plans d&rsquo;exp\u00e9rience<\/em>, <em>m\u00e9thodes de sondage<\/em>, <em>analyse statistique bay\u00e9sienne<\/em>, <em>analyse exploratoire des donn\u00e9es<\/em>, <em>analyse robuste<\/em>\u2026 Parall\u00e8lement des <em>strat\u00e9gies d&rsquo;analyse<\/em> ont vu le jour ainsi que des proc\u00e9dures de <em>diffusion des r\u00e9sultats d&rsquo;analyse<\/em> appropri\u00e9es.<\/p>\n<p>Les donn\u00e9es sont \u00e0 pr\u00e9sent <em>multivari\u00e9es<\/em>, elles sont <em>qualitatives<\/em> ou <em>quantitatives<\/em>, il en est de <em>manquantes<\/em> et d&rsquo;<em>extr\u00eames<\/em>, elles deviennent de plus en plus nombreuses. En ce d\u00e9but de 21<sup>\u00e8me<\/sup> si\u00e8cle, les <em>m\u00e9gadonn\u00e9es<\/em>, encore appel\u00e9es <em>donn\u00e9es massives<\/em> ou <em>big data<\/em> nous lancent des d\u00e9fis de toute nature\u00a0: m\u00e9thodologiques, techniques, juridiques\u2026 Le statisticien de demain se doit de s&rsquo;ouvrir encore davantage de la <em>science des donn\u00e9es<\/em>.<\/p>\n<h3><strong>Bibliographie<br \/>\n<\/strong><\/h3>\n<ul>\n<li>ACADEMIE ROYALE DE BELGIQUE (1997), <em>Actualit\u00e9 et universalit\u00e9 de la pens\u00e9e scientifique d&rsquo;Adolphe Quetelet<\/em>, Actes du Colloque des 24 et 25 octobre 1996, textes rassembl\u00e9es sous la direction scientifique de J.-J. Droesbeke, <em>M\u00e9moire de la Classe des Sciences<\/em>, 3<sup>\u00e8me<\/sup> s\u00e9rie, tome 13.<strong><br \/>\n<\/strong><\/li>\n<li>DESROSIERES A. (1993), <em>La politique des grands nombres. Histoire de la raison statistique<\/em>, Paris, La D\u00e9couverte.<strong><br \/>\n<\/strong><\/li>\n<li>DROESBEKE J.-J., MAUMY-BERTRAND M., SAPORTA G. et THOMAS-AGNAN Ch. Eds. (2016), <em>Models choices and agregations<\/em>, Paris, Technip (\u00e0 para\u00eetre).<\/li>\n<li>DROESBEKE J.-J. et SAPORTA G. (2010), Les mod\u00e8les et leur histoire, dans Droesbeke J.-J. et Saporta G. (\u00e9ds), <em>Analyse statistique des donn\u00e9es longitudinales<\/em>, Paris, Technip, 1-14.<\/li>\n<li>DROESBEKE J.-J. et TASSI Ph. (2015), <em>Histoire de la statistique<\/em>, 2<sup>\u00e8me<\/sup> \u00e9dition corrig\u00e9e, Collection Que sais-je\u00a0?, IAD, Paris, Presses Universitaires de France.<\/li>\n<li>DROESBEKE J.-J. et VERMANDELE C. (2016), <em>Les nombres au quotidien <\/em>(\u00e0 para\u00eetre).<\/li>\n<li>HECHT J. (1987), L&rsquo;id\u00e9e de d\u00e9nombrement jusqu&rsquo;\u00e0 la r\u00e9volution, dans Affichar, J. (\u00e9d.), <em>Pour une histoire de la statistique<\/em>, 1, Paris, Economica, 21-81.<\/li>\n<li>REY A., TOMI M., HORDE T. et TANET Ch. (1993), <em>Dictionnaire historique de la langue fran\u00e7aise<\/em>, 2<sup>\u00e8me<\/sup> \u00e9dition, Paris, Dictionnaire Le Robert.<\/li>\n<\/ul>\n<p><span style=\"border-radius: 2px; text-indent: 20px; width: auto; padding: 0px 4px 0px 0px; text-align: center; font: bold 11px\/20px 'Helvetica Neue',Helvetica,sans-serif; color: #ffffff; background: #bd081c no-repeat scroll 3px 50% \/ 14px 14px; position: absolute; opacity: 1; z-index: 8675309; display: none; cursor: pointer;\">Enregistrer<\/span><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Article initialement publi\u00e9 dans Variances n\u00b053 d&rsquo;octobre 2015, num\u00e9ro d\u00e9di\u00e9 \u00e0 la Conf\u00e9rence \u00ab\u00a0Individus, donn\u00e9es &amp; soci\u00e9t\u00e9 connect\u00e9e\u00a0\u00bb qui s&rsquo;est tenue le 18 juin 2015 au CNAM. L&rsquo;auteur, Jean-Jacques Droesbeke, qui est Professeur \u00e9m\u00e9rite de l&rsquo;Universit\u00e9 Libre de Bruxelles, intervenait \u00e0 l&rsquo;occasion de l&rsquo;introduction, et apr\u00e8s les discours d&rsquo;ouverture. L&rsquo;objet de cet article est de [&hellip;]<\/p>\n","protected":false},"author":301,"featured_media":5124,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_et_pb_use_builder":"","_et_pb_old_content":"","_et_gb_content_width":"","_exactmetrics_skip_tracking":false,"_exactmetrics_sitenote_active":false,"_exactmetrics_sitenote_note":"","_exactmetrics_sitenote_category":0,"footnotes":""},"categories":[15],"tags":[],"class_list":["post-5122","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-data-science","et-has-post-format-content","et_post_format-et-post-format-standard"],"_links":{"self":[{"href":"https:\/\/variances.eu\/index.php?rest_route=\/wp\/v2\/posts\/5122","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/variances.eu\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/variances.eu\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/variances.eu\/index.php?rest_route=\/wp\/v2\/users\/301"}],"replies":[{"embeddable":true,"href":"https:\/\/variances.eu\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=5122"}],"version-history":[{"count":0,"href":"https:\/\/variances.eu\/index.php?rest_route=\/wp\/v2\/posts\/5122\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/variances.eu\/index.php?rest_route=\/wp\/v2\/media\/5124"}],"wp:attachment":[{"href":"https:\/\/variances.eu\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=5122"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/variances.eu\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=5122"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/variances.eu\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=5122"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}