{"id":4696,"date":"2020-02-10T07:35:02","date_gmt":"2020-02-10T05:35:02","guid":{"rendered":"http:\/\/variances.eu\/?p=4696"},"modified":"2020-07-20T09:50:49","modified_gmt":"2020-07-20T07:50:49","slug":"pourquoi-le-secret-est-indispensable-pour-avoir-de-bonnes-statistiques","status":"publish","type":"post","link":"https:\/\/variances.eu\/?p=4696","title":{"rendered":"Pourquoi le secret est indispensable pour avoir de bonnes statistiques !"},"content":{"rendered":"<p><span style=\"color: #0000ff;\"><em>Variances remercie chaudement Jean-Pierre Le Gl\u00e9au (ENSAE 1972) pour ce r\u00e9sum\u00e9 sp\u00e9cialement r\u00e9dig\u00e9 pour les lecteurs de Variances de son livre\u00a0publi\u00e9 en 2019 chez EDP Sciences : Le secret statistique.<\/em><\/span><\/p>\n<p>Imaginons un instant que les informations recueillies par l\u2019Insee (recensements, enqu\u00eates aupr\u00e8s des m\u00e9nages, des entreprises) soient libres d\u2019acc\u00e8s \u00e0 tout un chacun, sans pr\u00e9caution sp\u00e9ciale. Ce serait une catastrophe\u00a0! Les particuliers n\u2019accepteraient pas que la divulgation de leurs r\u00e9ponses aux enqu\u00eates risque de leur porter tort, notamment vis-\u00e0-vis des imp\u00f4ts, de leur assureur, de leurs voisins, de la police \u2026 Et les entreprises ne pourraient admettre que les informations qu\u2019elles confient \u00e0 l\u2019Insee soient mises \u00e0 la disposition de leurs concurrents. De ce fait, de nombreux enqu\u00eat\u00e9s refuseraient de r\u00e9pondre ou seraient tent\u00e9s de donner des r\u00e9ponses inexactes.<\/p>\n<p>C\u2019est pourquoi le l\u00e9gislateur a mis en place, d\u00e8s 1951, une forme sp\u00e9ciale de secret couvrant ces informations\u00a0: c\u2019est ce que l\u2019on appelle le secret statistique. D\u00e8s sa cr\u00e9ation, ce secret \u00e9tait dot\u00e9 d\u2019une grande force, qui le pla\u00e7ait entre autres au-dessus du secret fiscal\u00a0: en effet, alors que la loi pr\u00e9voit que le fisc et les douanes ont acc\u00e8s \u00e0 toutes les informations recueillies par les administrations, elle fait une exception pour les donn\u00e9es collect\u00e9es par l\u2019Insee, qui ne peuvent en aucun cas leur \u00eatre transmises. En revanche, en sens inverse, les donn\u00e9es fiscales et douani\u00e8res peuvent \u00eatre fournies \u00e0 l\u2019Insee pour l\u2019aider \u00e0 \u00e9tablir ses statistiques.<\/p>\n<p>La loi \u00e9tablit donc que les donn\u00e9es nominatives recueillies par l\u2019Insee (et plus g\u00e9n\u00e9ralement par le service statistique public) ne peuvent faire l\u2019objet d\u2019aucune communication, sous peine de sanctions tr\u00e8s lourdes (un an d\u2019emprisonnement et quinze mille euros d\u2019amende). Fort heureusement, ces sanctions n\u2019ont, \u00e0 ce jour, pas trouv\u00e9 d\u2019occasion de se faire appliquer.<\/p>\n<p>Mais les statistiques \u00e9tablies \u00e0 partir de ces donn\u00e9es ont bien \u00e9videmment vocation \u00e0 \u00eatre largement diffus\u00e9es. Le hic, c\u2019est que des r\u00e9sultats portant sur des effectifs trop faibles pourraient permettre de d\u00e9duire des informations individuelles exactes, ou au moins approximatives, sur certaines personnes ou sur certaines entreprises. Pour \u00e9viter cela, on a \u00e9tabli des r\u00e8gles pour la diffusion des donn\u00e9es agr\u00e9g\u00e9es. Par exemple, il est interdit de diffuser des tableaux concernant des entreprises dans lesquels la valeur figurant dans une des cases serait imputable pour plus de 85 % \u00e0 une seule entreprise. M\u00eame chose si le r\u00e9sultat figurant dans une case concerne moins de trois entreprises. On comprend bien pourquoi\u00a0: si on autorisait la divulgation de chiffres concernant deux entreprises, chacune d\u2019entre elles conna\u00eetrait, par d\u00e9duction, le r\u00e9sultat de l\u2019autre\u00a0! De m\u00eame, les tableaux concernant les individus ne doivent pas pr\u00e9senter des croisements permettant d\u2019identifier l\u2019un d\u2019entre eux. Au-del\u00e0 du secret statistique proprement dit, la Commission nationale de l\u2019informatique et des libert\u00e9s (Cnil) a fix\u00e9 des r\u00e8gles compl\u00e9mentaires pour ne m\u00eame pas pouvoir effectuer des \u00ab\u00a0profils\u00a0\u00bb de personnes, m\u00eame sans parler de les identifier individuellement.<\/p>\n<p>Ces r\u00e8gles se sont \u00e9largies au cours du temps \u00e0 la diffusion de fichiers individuels \u00ab\u00a0anonymes\u00a0\u00bb, c\u2019est-\u00e0-dire dans lesquels il n\u2019y a plus d\u2019identifiant direct (nom, pr\u00e9nom ou raison sociale). Mais il faut faire attention\u00a0! Par exemple, pour les entreprises, dans un fichier o\u00f9 l\u2019on a retir\u00e9 le nom des soci\u00e9t\u00e9s, on peut quand m\u00eame souvent en identifier quelques-unes gr\u00e2ce \u00e0 leur activit\u00e9, \u00e0 leur taille et \u00e0 une localisation, m\u00eame grossi\u00e8re (\u00ab\u00a0un \u00e9tablissement du secteur automobile, de plus de 10\u00a0000 salari\u00e9s en Franche-Comt\u00e9\u00a0\u00bb\u2026). De m\u00eame, pour les fichiers d\u2019individus, il est souvent possible de reconna\u00eetre une personne en utilisant des croisements d\u2019informations non nominatives (\u00e2ge, nationalit\u00e9, lieu de r\u00e9sidence, etc.). En r\u00e9alit\u00e9, la suppression du nom et de la raison sociale est bien insuffisante pour vraiment anonymiser un fichier. On parle souvent, dans ce cas, de fichiers \u00ab\u00a0pseudonymis\u00e9s\u00a0\u00bb\u00a0: on n\u2019a pas l\u2019identification directe des personnes, mais on pourrait, en se donnant un peu de mal, en reconna\u00eetre quelques-unes. Diverses techniques sont possibles pour arriver \u00e0 un fichier vraiment anonyme. Mais c\u2019est toujours au prix d\u2019une perte plus ou moins importante d\u2019information\u00a0: agr\u00e9gation, nomenclature plus grossi\u00e8re, \u00e9chantillonnage\u2026<\/p>\n<p>Or, ces fichiers servent aussi aux chercheurs. Et ceux-ci ont souvent besoin d\u2019une information individuelle tr\u00e8s fine. Leur but n\u2019est \u00e9videmment pas de reconna\u00eetre telle ou telle personne. Mais ils souhaitent pouvoir croiser des informations venant de diff\u00e9rentes sources (emploi, sant\u00e9, revenus\u2026) ou suivre une \u00e9volution temporelle pour un individu (ce qu\u2019on appelle une \u00ab\u00a0trajectoire individuelle\u00a0\u00bb). Comme les techniques statistiques et les ordinateurs ont \u00e9volu\u00e9 et permettent maintenant d\u2019analyser de tr\u00e8s gros fichiers de donn\u00e9es, les chercheurs sont de plus en plus demandeurs d\u2019une information d\u00e9taill\u00e9e. Pour leur permettre d\u2019y acc\u00e9der, dans le cadre du secret statistique, la loi a \u00e9volu\u00e9 et des protocoles ont \u00e9t\u00e9 mis au point pour permettre aux chercheurs d\u2019acc\u00e9der \u00e0 des informations tr\u00e8s fines, sans pour autant autoriser une diffusion de donn\u00e9es tr\u00e8s d\u00e9taill\u00e9es.<\/p>\n<p>La loi a notamment cr\u00e9\u00e9 un Comit\u00e9 du secret statistique. C\u2019est un organisme o\u00f9 sont repr\u00e9sent\u00e9es toutes les parties prenantes\u00a0: producteurs de donn\u00e9es, chercheurs, Cnil, syndicats, \u00e9lus, etc. Ce comit\u00e9 est amen\u00e9 \u00e0 donner son avis sur toute diffusion, individuelle ou g\u00e9n\u00e9rale, de donn\u00e9es confidentielles utilis\u00e9es pour la production de statistiques publiques. Il donne \u00e9galement un avis sur la fa\u00e7on dont ces donn\u00e9es peuvent \u00eatre communiqu\u00e9es aux chercheurs.<\/p>\n<p>En 2010, a \u00e9t\u00e9 cr\u00e9\u00e9 \u00e0 cette fin le Centre d\u2019acc\u00e8s s\u00e9curis\u00e9 aux donn\u00e9es (CASD) qui permet aux chercheurs de travailler de fa\u00e7on confortable sur des fichiers tr\u00e8s d\u00e9taill\u00e9s, tout en emp\u00eachant la diffusion de donn\u00e9es identifiables. Le principe est que les donn\u00e9es restent sur le serveur. Elles ne sont accessibles pour le chercheur que via un terminal, appel\u00e9 SD-Box, qui leur permet de \u00ab\u00a0voir\u00a0\u00bb les donn\u00e9es confidentielles (pseudonymis\u00e9es), de travailler dessus, mais jamais de les t\u00e9l\u00e9charger, de les extraire, ni de les imprimer. Les chercheurs s\u2019engagent par ailleurs \u00e0 ne pas tenter de reconna\u00eetre des personnes en utilisant une m\u00e9thode d\u2019identification indirecte. Tous les fichiers interm\u00e9diaires cr\u00e9\u00e9s par le chercheur restent aussi sur le serveur du CASD. Ce n\u2019est que lorsqu\u2019il a termin\u00e9 la production de statistiques, tableaux, cartes pour son \u00e9tude qu\u2019il peut demander \u00e0 avoir acc\u00e8s au fichier de r\u00e9sultats qu\u2019il a cr\u00e9\u00e9. Une \u00e9quipe sp\u00e9cialis\u00e9e du CASD v\u00e9rifie alors que ce fichier ne contient plus d\u2019informations confidentielles. Puis il est transmis au chercheur.<\/p>\n<p>Cette technique, initialement r\u00e9serv\u00e9e aux fichiers cr\u00e9\u00e9s par le service statistique public, a connu un tel succ\u00e8s que bient\u00f4t d\u2019autres fournisseurs de donn\u00e9es ont souhait\u00e9 l\u2019utiliser pour mettre leurs fichiers \u00e0 la disposition des chercheurs. C\u2019est ainsi que le CASD permet maintenant, en toute s\u00e9curit\u00e9, l\u2019acc\u00e8s aux donn\u00e9es fiscales et aux donn\u00e9es de sant\u00e9 \u00e0 des fins de recherche. Les textes l\u00e9gislatifs, qui r\u00e9gissaient le secret concernant ces donn\u00e9es, ont \u00e9t\u00e9 modifi\u00e9s en cons\u00e9quence.<\/p>\n<p>Par rapport \u00e0 ses voisins, la France se distingue par un souci de protection tr\u00e8s \u00e9lev\u00e9 des donn\u00e9es \u00e0 caract\u00e8re personnel. Rappelons que la premi\u00e8re loi prot\u00e9geant ce type de donn\u00e9es a \u00e9t\u00e9 la loi fran\u00e7aise dite \u00ab\u00a0Informatique et libert\u00e9s\u00a0\u00bb, en janvier 1978. Depuis 2016, un r\u00e8glement europ\u00e9en harmonise les pratiques dans tous les pays de l\u2019Union. Mais certains pays, tout en ayant le souci de la protection des donn\u00e9es personnelles, sont encore plus stricts sur les donn\u00e9es d\u2019entreprises.<\/p>\n<p>Pour la mise \u00e0 la disposition des chercheurs de donn\u00e9es tr\u00e8s d\u00e9taill\u00e9es, la France a longtemps \u00e9t\u00e9 dans le peloton de queue. Des arrangements permettaient aux chercheurs d\u2019avoir acc\u00e8s \u00e0 ces fichiers, dans des conditions pas toujours tr\u00e8s confortables. Les vrais pionniers en la mati\u00e8re \u00e9taient les pays du Nord, notamment le Canada, le Danemark et les Pays-Bas. Derni\u00e8re arriv\u00e9e, la France a b\u00e9n\u00e9fici\u00e9 de l\u2019exp\u00e9rience (et parfois des \u00e9checs) de ces pays pour se placer r\u00e9solument en t\u00eate des pays les plus performants dans ce domaine. Des groupes de travail europ\u00e9ens tentent maintenant de faire b\u00e9n\u00e9ficier tous les pays de l\u2019Union de l\u2019exp\u00e9rience fran\u00e7aise.<\/p>\n<p>Il est \u00e0 noter que le secret statistique concerne les donn\u00e9es trait\u00e9es par la statistique publique. D\u2019autres organismes, non publics, collectent de l\u2019information comme sous-produit de leur activit\u00e9 (Google, Orange, Amazon, etc.). Ces organismes ne sont pas soumis au secret statistique. Ils doivent en revanche se conformer aux r\u00e8gles g\u00e9n\u00e9rales sur la protection des donn\u00e9es personnelles, comme par exemple le r\u00e8glement europ\u00e9en (RGPD), entr\u00e9 en vigueur le 25 mai 2018.<\/p>\n<p>Tous les aspects de ces questions autour du secret statistique sont analys\u00e9s en d\u00e9tail dans mon livre, intitul\u00e9 \u00ab\u00a0Le secret statistique\u00a0\u00bb. On en trouvera la r\u00e9f\u00e9rence sur le site de l\u2019\u00e9diteur\u00a0:<\/p>\n<p><span style=\"text-decoration: underline;\"><span style=\"color: #0000ff;\"><a style=\"color: #0000ff; text-decoration: underline;\" href=\"https:\/\/laboutique.edpsciences.fr\/produit\/1074\/9782759823420\/Le%20secret%20statistique\">https:\/\/laboutique.edpsciences.fr\/produit\/1074\/9782759823420\/Le%20secret%20statistique<\/a><\/span><\/span><\/p>\n<p>Cet ouvrage est le premier \u00e0 faire un bilan complet des r\u00e8gles et pratiques qui permettent de garantir le secret statistique.<\/p>\n<p><em>Mots-cl\u00e9s : secret statistique &#8211; donn\u00e9es personnelles &#8211; acc\u00e8s des chercheurs &#8211; donn\u00e9es fiscales &#8211; donn\u00e9es de sant\u00e9<\/em><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Variances remercie chaudement Jean-Pierre Le Gl\u00e9au (ENSAE 1972) pour ce r\u00e9sum\u00e9 sp\u00e9cialement r\u00e9dig\u00e9 pour les lecteurs de Variances de son livre\u00a0publi\u00e9 en 2019 chez EDP Sciences : Le secret statistique. Imaginons un instant que les informations recueillies par l\u2019Insee (recensements, enqu\u00eates aupr\u00e8s des m\u00e9nages, des entreprises) soient libres d\u2019acc\u00e8s \u00e0 tout un chacun, sans pr\u00e9caution [&hellip;]<\/p>\n","protected":false},"author":281,"featured_media":4698,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_et_pb_use_builder":"","_et_pb_old_content":"","_et_gb_content_width":"","_exactmetrics_skip_tracking":false,"_exactmetrics_sitenote_active":false,"_exactmetrics_sitenote_note":"","_exactmetrics_sitenote_category":0,"footnotes":""},"categories":[31,12,228],"tags":[],"class_list":["post-4696","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-dans-les-rayons","category-alumni","category-fev2020","et-has-post-format-content","et_post_format-et-post-format-standard"],"_links":{"self":[{"href":"https:\/\/variances.eu\/index.php?rest_route=\/wp\/v2\/posts\/4696","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/variances.eu\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/variances.eu\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/variances.eu\/index.php?rest_route=\/wp\/v2\/users\/281"}],"replies":[{"embeddable":true,"href":"https:\/\/variances.eu\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=4696"}],"version-history":[{"count":0,"href":"https:\/\/variances.eu\/index.php?rest_route=\/wp\/v2\/posts\/4696\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/variances.eu\/index.php?rest_route=\/wp\/v2\/media\/4698"}],"wp:attachment":[{"href":"https:\/\/variances.eu\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=4696"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/variances.eu\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=4696"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/variances.eu\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=4696"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}