{"id":6257,"date":"2021-11-25T06:50:53","date_gmt":"2021-11-25T04:50:53","guid":{"rendered":"http:\/\/variances.eu\/?p=6257"},"modified":"2021-11-25T08:21:47","modified_gmt":"2021-11-25T06:21:47","slug":"le-role-irremplacable-dune-statistique-independante-de-la-gestion","status":"publish","type":"post","link":"https:\/\/variances.eu\/?p=6257","title":{"rendered":"Le r\u00f4le irrempla\u00e7able d\u2019une statistique ind\u00e9pendante de la gestion"},"content":{"rendered":"<p>Depuis le d\u00e9but de la pand\u00e9mie de la Covid-19, beaucoup de statistiques ont \u00e9t\u00e9 utilis\u00e9es dans le d\u00e9bat public pour d\u00e9crire les fluctuations de l\u2019\u00e9pid\u00e9mie et pour justifier les politiques publiques. Ces statistiques ont presque toujours \u00e9t\u00e9 d\u2019origine administrative ou professionnelle. En France, elles proviennent, pour l\u2019essentiel, de l\u2019administration des h\u00f4pitaux, des praticiens de la sant\u00e9 ou de la s\u00e9curit\u00e9 sociale (assurance maladie). Une seule enqu\u00eate ind\u00e9pendante de la gestion sanitaire administrative a \u00e9t\u00e9 men\u00e9e (\u00e0 ma connaissance)\u00a0: c\u2019est l\u2019enqu\u00eate EPICOV<a href=\"#_ftn1\" name=\"_ftnref1\">[1]<\/a>, men\u00e9e en trois vagues depuis le printemps 2020. Elle a \u00e9t\u00e9 surtout exploit\u00e9e pour mettre en lumi\u00e8re les disparit\u00e9s sociales de l\u2019impact de la pand\u00e9mie et tr\u00e8s peu pour en cerner l\u2019importance<a href=\"#_ftn2\" name=\"_ftnref2\">[2]<\/a>.<\/p>\n<p>Rappelons la diff\u00e9rence essentielle entre ces deux types de statistiques. Quand elle utilise des donn\u00e9es administratives ou des donn\u00e9es d\u2019entreprises, la profession statistique essaye de tirer le meilleur parti possible d\u2019un mat\u00e9riau qui n\u2019a pas \u00e9t\u00e9 con\u00e7u pour produire de l\u2019information, mais pour d\u2019autres buts. Elle n\u2019a pas la ma\u00eetrise sur les conditions qui pr\u00e9sident au recueil des donn\u00e9es\u00a0: les champs couverts, les concepts et les nomenclatures utilis\u00e9s, tout cela lui est, pour l\u2019essentiel, impos\u00e9 de l\u2019ext\u00e9rieur. Les conclusions des analyses en d\u00e9pendent in\u00e9vitablement. C\u2019est le contraire dans le cas d\u2019une enqu\u00eate cr\u00e9\u00e9e ex nihilo. D\u00e8s la conception de l\u2019enqu\u00eate, la vis\u00e9e informative est pr\u00e9sente et d\u00e9termine le choix des unit\u00e9s interrog\u00e9es, des d\u00e9finitions et des interrogations. Si le processus est bien pr\u00e9par\u00e9 et bien conduit, le r\u00e9sultat donne des r\u00e9ponses claires \u00e0 des questions connues avant le d\u00e9but du processus.<\/p>\n<h3><strong>En statistique publique<\/strong><\/h3>\n<p>Cette opposition fait partie de la culture de la statistique publique. Aux avantages des enqu\u00eates, qui viennent d\u2019\u00eatre pr\u00e9sent\u00e9s, les partisans de l\u2019exploitation des donn\u00e9es administratives<a href=\"#_ftn3\" name=\"_ftnref3\">[3]<\/a> opposent deux arguments tr\u00e8s forts\u00a0: leur moindre co\u00fbt et le d\u00e9tail qu\u2019elles permettent d\u2019obtenir. Produites pour d\u2019autres fins, les donn\u00e9es administratives ne co\u00fbtent presque rien au syst\u00e8me statistique public, alors que la collecte d\u2019une enqu\u00eate est tr\u00e8s on\u00e9reuse. Par ailleurs, les donn\u00e9es administratives, g\u00e9n\u00e9ralement exhaustives dans le champ qu\u2019elles couvrent, peuvent \u00eatre exploit\u00e9es \u00e0 des niveaux g\u00e9ographiques fins ou selon beaucoup d\u2019autres nomenclatures\u00a0; tandis que les donn\u00e9es d\u2019enqu\u00eates sont presque toujours recueillies par \u00e9chantillonnage, ce qui limite drastiquement les exploitations possibles.<\/p>\n<p>La mesure du ch\u00f4mage est l\u2019exemple traditionnel o\u00f9 coexistent les deux types de statistiques. D\u2019un c\u00f4t\u00e9, l\u2019exploitation des donn\u00e9es administratives issues de P\u00f4le Emploi\u00a0; de l\u2019autre, une tr\u00e8s grande enqu\u00eate par sondage, l\u2019enqu\u00eate emploi, dont la s\u00e9rie actuelle est l\u2019h\u00e9riti\u00e8re d\u2019une longue histoire commenc\u00e9e vers 1950. Cet ancrage historique explique sans doute que le syst\u00e8me statistique public r\u00e9ussisse \u00e0 maintenir une certaine primaut\u00e9 du r\u00e9sultat des enqu\u00eates emploi dans le d\u00e9bat public, malgr\u00e9 bien des vicissitudes\u00a0: jusqu\u2019\u00e0 nouvel ordre, le taux de ch\u00f4mage qui fait foi reste celui de l\u2019enqu\u00eate emploi. Et lorsque les deux sources divergent fortement, comme ce fut le cas entre 2014 et 2018, leur rapprochement est riche d\u2019enseignements (dans ce cas, il a permis de mettre en lumi\u00e8re le d\u00e9veloppement des situations interm\u00e9diaires entre emploi et ch\u00f4mage).<\/p>\n<p>Ce succ\u00e8s n\u2019est pas le seul\u00a0: comme autre exemple, on peut citer les enqu\u00eates de victimation, introduites il y a une trentaine d\u2019ann\u00e9es pour tenter de pallier les d\u00e9ficiences de la statistique polici\u00e8re. Mais il faut bien reconna\u00eetre que la tendance g\u00e9n\u00e9rale est dans l\u2019autre sens. Soumis \u00e0 des contraintes budg\u00e9taires fortes, de mieux en mieux arm\u00e9 juridiquement pour obtenir les donn\u00e9es des autres administrations publiques, voire certaines donn\u00e9es priv\u00e9es, le syst\u00e8me statistique public recourt de plus en plus aux fichiers administratifs (et notamment aux fichiers socio-fiscaux). Et il en tire une information de plus en plus riche\u00a0: le public appr\u00e9cie beaucoup qu\u2019une information statistique puisse \u00eatre rapproch\u00e9e de lui g\u00e9ographiquement et renouvel\u00e9e fr\u00e9quemment.<\/p>\n<p>La m\u00eame tendance s\u2019observe s\u2019agissant de la connaissance des m\u00e9nages et de la connaissance des entreprises. Dans ce dernier cas, les donn\u00e9es administratives se pr\u00e9valent aussi de l\u2019imp\u00e9ratif d\u2019all\u00e9ger la charge de r\u00e9ponse. La quasi-totalit\u00e9 des donn\u00e9es comptables utilis\u00e9es dans le syst\u00e8me statistique public provient d\u00e9sormais des d\u00e9clarations fiscales des entreprises. Au point qu\u2019il est permis de craindre que les limitations \u00ab\u00a0g\u00e9n\u00e9tiques\u00a0\u00bb des donn\u00e9es administratives soient tr\u00e8s peu mises en avant, sinon carr\u00e9ment oubli\u00e9es. On peut craindre que la r\u00e9alit\u00e9 administrative finisse par recouvrir la r\u00e9alit\u00e9 \u00e9conomique et sociale, imposant ses concepts et laissant \u00e9chapper \u00e0 l\u2019observation des pans de la r\u00e9alit\u00e9 qu\u2019elle ignore.<\/p>\n<p><strong>En \u00e9pid\u00e9miologie<\/strong><\/p>\n<p>N\u2019\u00e9tant pas \u00e9pid\u00e9miologiste, j\u2019apporte ici le point de vue d\u2019un pur utilisateur.<\/p>\n<p>Lorsqu\u2019ils exposent les principes de leurs mod\u00e8les, les \u00e9pid\u00e9miologistes introduisent \u00e0 propos d\u2019une maladie dans une population donn\u00e9e des concepts tels que la pr\u00e9valence (rapport entre le nombre des malades \u00e0 un instant donn\u00e9 et la population totale) et l\u2019incidence (rapport entre le nombre de nouveaux malades, durant une p\u00e9riode donn\u00e9e et la population qui \u00e9tait susceptible de tomber malade en d\u00e9but de p\u00e9riode). Ils d\u00e9crivent ensuite la dynamique de l\u2019\u00e9pid\u00e9mie \u00e0 l\u2019aide de ces concepts, et d\u2019autres qui en sont d\u00e9riv\u00e9s, comme le c\u00e9l\u00e8bre \u00ab\u00a0R\u00a0\u00bb, \u00ab\u00a0nombre de reproduction\u00a0\u00bb\u00a0qui indique si l\u2019\u00e9pid\u00e9mie progresse, stagne ou r\u00e9gresse.<\/p>\n<p>En pratique, dans le cas de la Covid-19, Sant\u00e9 Publique France, dans son point \u00e9pid\u00e9miologique hebdomadaire, fournit des chiffres pour le taux d\u2019incidence et pour le \u00ab\u00a0R-effectif\u00a0\u00bb, chiffres d\u00e9taill\u00e9s g\u00e9ographiquement, par \u00e2ge, etc. Il n\u2019est pas facile de trouver la source exacte de ces chiffres\u00a0: les documents m\u00e9thodologiques ne sont pas mis en avant. Il semble que l\u2019incidence soit calcul\u00e9e \u00e0 partir des r\u00e9sultats des tests auxquels s\u2019est soumise une partie de la population\u00a0: les \u00ab\u00a0nouveaux cas\u00a0\u00bb sont en r\u00e9alit\u00e9 les \u00ab\u00a0tests positifs\u00a0\u00bb, alors que l\u2019on peut \u00ab\u00a0attraper la Covid\u00a0\u00bb sans \u00eatre test\u00e9, surtout s\u2019agissant d\u2019une maladie souvent asymptomatique. Quant au d\u00e9nominateur, il s\u2019agit de la population totale et non pas de la population soumise au risque de tomber malade, qui repr\u00e9sente une fraction inconnue de la population totale. On le voit, le taux d\u2019incidence est calcul\u00e9 \u00e0 partir de sources qui n\u2019ont pas \u00e9t\u00e9 con\u00e7ues pour cela\u00a0: on retrouve ici la limitation fondamentale d\u00e9crite plus haut. Ni la d\u00e9finition de \u00ab\u00a0qui est malade\u00a0?\u00a0\u00bb, ni le champ d\u2019observation des malades potentiels ne sont contr\u00f4l\u00e9s pour l\u2019observation.<\/p>\n<p>Faute d\u2019\u00eatre bien connu en niveau, le taux d\u2019incidence est-il mieux retrac\u00e9 en \u00e9volution par ces statistiques\u00a0administratives ? Pour l\u2019affirmer, il faut en particulier supposer que le biais, introduit en ne consid\u00e9rant que la population ayant subi un test, est constant\u00a0: c\u2019est une hypoth\u00e8se redoutable, la d\u00e9cision de se faire tester \u00e9tant fortement li\u00e9e \u00e0 la conjoncture de l\u2019\u00e9pid\u00e9mie, et aux mesures publiques qui l\u2019accompagnent. Si ce qui vient d\u2019\u00eatre dit est exact, en France, la politique publique de lutte contre l\u2019\u00e9pid\u00e9mie est pilot\u00e9e sur la base de chiffres certainement fiables, mais dont le rapport avec la r\u00e9alit\u00e9 \u00e9pid\u00e9mique peut \u00eatre brouill\u00e9, sans qu\u2019une enqu\u00eate de contr\u00f4le permette de surveiller leurs d\u00e9rives potentielles, comme l\u2019enqu\u00eate emploi le permet pour les chiffres de P\u00f4le Emploi. C\u2019est, pour le moins, inqui\u00e9tant\u00a0!<\/p>\n<p>Apparemment, la plupart des pays du monde sont dans la m\u00eame situation. Selon un r\u00e9cent article publi\u00e9 par Variances<a href=\"#_ftn4\" name=\"_ftnref4\">[4]<\/a>, la Grande-Bretagne fait exception. Elle a mis en place un dispositif d\u2019observation de la pr\u00e9valence de la maladie ind\u00e9pendant des sources administratives. On aimerait en savoir beaucoup plus sur la nature de ce dispositif et sur son efficacit\u00e9 pour contr\u00f4ler les autres sources.<\/p>\n<h3><strong>Pourquoi\u00a0si peu de donn\u00e9es d\u2019enqu\u00eates dans une discipline comme l\u2019\u00e9pid\u00e9miologie ?<\/strong><\/h3>\n<p>Si la statistique utilisant des donn\u00e9es administratives se taille la part du lion, c\u2019est \u00e9videmment pour la raison dite plus haut\u00a0: elle fournit plus de d\u00e9tail pour un moindre co\u00fbt. C\u2019est encore plus vrai des sources de donn\u00e9es non structur\u00e9es souvent appel\u00e9es \u00ab\u00a0big data\u00a0\u00bb, capt\u00e9es \u00ab\u00a0au fil de l\u2019eau\u00a0\u00bb et analys\u00e9es ensuite par les techniques statistiques les plus avanc\u00e9es. Ces techniques se font fort de pouvoir tenir compte de toutes les sources d\u2019incertitude, y compris peut-\u00eatre l\u2019instabilit\u00e9 des d\u00e9finitions et des champs d\u2019observation. Si cette pr\u00e9tention est justifi\u00e9e, l\u2019avantage des enqu\u00eates traditionnelles tend \u00e9videmment \u00e0 s\u2019amenuiser. C\u2019est une question qui m\u00e9riterait d\u2019\u00eatre approfondie.<\/p>\n<p>Mais le principal aspect du probl\u00e8me est celui du prix qu\u2019on attache \u00e0 une information de qualit\u00e9. Les enqu\u00eates statistiques sont ch\u00e8res, d\u2019autant plus ch\u00e8res que l\u2019on s\u2019attache \u00e0 pr\u00e9server le mieux possible ce qui en fait l\u2019int\u00e9r\u00eat sp\u00e9cifique. Contr\u00f4ler le champ d\u2019observation implique de recourir \u00e0 des bases de sondage idoines, qu\u2019il faut dans certains cas cr\u00e9er \u00e0 grands frais. Observer tous les cas qu\u2019on a d\u00e9cid\u00e9 a priori d\u2019observer n\u00e9cessite des efforts tr\u00e8s co\u00fbteux pour atteindre les unit\u00e9s les plus difficiles \u00e0 joindre. Appliquer dans l\u2019observation des d\u00e9finitions pr\u00e9cises entra\u00eene des pr\u00e9cautions dans le recueil des donn\u00e9es, qui peuvent n\u00e9cessiter l\u2019intervention d\u2019enqu\u00eateurs sp\u00e9cialis\u00e9s. Au bout du compte, on r\u00e9cup\u00e8re des donn\u00e9es de meilleure qualit\u00e9, mais moins nombreuses. Faute d\u2019un prix \u00e9lev\u00e9 pour ces donn\u00e9es, l\u2019arbitrage est rendu en d\u00e9faveur des enqu\u00eates.<\/p>\n<p>\u00ab\u00a0Prix\u00a0\u00bb ne peut pas s\u2019entendre ici dans son sens mon\u00e9taire\u00a0: il n\u2019y a pas de r\u00e9el march\u00e9 pour l\u2019information mise sur la place publique. Ce qui est en jeu, c\u2019est l\u2019importance que la soci\u00e9t\u00e9 attache \u00e0 disposer d\u2019une information concernant des ph\u00e9nom\u00e8nes sociaux qui soit ind\u00e9pendante des cadres administratifs (au sens large). Cette importance se traduit par les moyens accord\u00e9s \u00e0 la r\u00e9alisation d\u2019enqu\u00eates, sans contrepartie mon\u00e9taire directe. Dans le cas de la Covid-19, en France, de tels moyens ont-ils \u00e9t\u00e9 demand\u00e9s\u00a0pour des enqu\u00eates de pr\u00e9valence ou d\u2019incidence repr\u00e9sentatives de la population et fr\u00e9quemment r\u00e9p\u00e9t\u00e9es ? On ne sait pas. S\u2019ils ont \u00e9t\u00e9 demand\u00e9s, ont-ils \u00e9t\u00e9 refus\u00e9s\u00a0? Toujours est-il que ces moyens n\u2019ont pas \u00e9t\u00e9 mis en place.\u00a0 En toute hypoth\u00e8se, quelque part la conviction a manqu\u00e9\u00a0: on n\u2019a pas estim\u00e9 que cela valait le co\u00fbt, malgr\u00e9 l\u2019importance des politiques publiques en jeu.<\/p>\n<p>De ce fait on ne saura pas \u00e0 quel degr\u00e9 les indicateurs utilis\u00e9s \u00e9taient erron\u00e9s, ni les cons\u00e9quences que ces erreurs ont entra\u00een\u00e9es. Raison de plus pour analyser de tr\u00e8s pr\u00e8s les le\u00e7ons de l\u2019exp\u00e9rience anglaise cit\u00e9e par Variances.<\/p>\n<p>&nbsp;<\/p>\n<p><em>Mots-cl\u00e9s : statistiques &#8211; enqu\u00eates &#8211; sant\u00e9 &#8211; donn\u00e9es administratives<\/em><\/p>\n<hr \/>\n<p><a href=\"#_ftnref1\" name=\"_ftn1\">[1]<\/a>\u00a0\u00a0\u00a0\u00a0 \u00ab\u00a0Epid\u00e9miologie et conditions de vie sous le covid-19\u00a0\u00bb R\u00e9f.: <span style=\"text-decoration: underline;\"><a href=\"https:\/\/drees.solidarites-sante.gouv.fr\/sources-outils-et-enquetes\/enquete-epicov-epidemiologie-et-conditions-de-vie-sous-le-covid-19\"><span style=\"color: #0000ff; text-decoration: underline;\">https:\/\/drees.solidarites-sante.gouv.fr\/sources-outils-et-enquetes\/enquete-epicov-epidemiologie-et-conditions-de-vie-sous-le-covid-19<\/span><\/a><\/span><\/p>\n<p><a href=\"#_ftnref2\" name=\"_ftn2\">[2]<\/a>\u00a0\u00a0\u00a0\u00a0 On peut citer aussi les enqu\u00eates men\u00e9es aupr\u00e8s des participants \u00e0 la cohorte \u00e9pid\u00e9miologique \u00ab\u00a0Constances\u00a0\u00bb\u00a0; mais ces enqu\u00eates n\u2019ont pas vocation \u00e0 repr\u00e9senter la population totale.<\/p>\n<p><a href=\"#_ftnref3\" name=\"_ftn3\">[3]<\/a>\u00a0\u00a0\u00a0\u00a0 Prises ici au sens large\u00a0: issues de l\u2019activit\u00e9 courante d\u2019administrations ou d\u2019entreprises, voire de m\u00e9nages.<\/p>\n<p><a href=\"#_ftnref4\" name=\"_ftn4\">[4]<\/a>\u00a0\u00a0\u00a0\u00a0 \u00ab\u00a0Covid-19 Anatomy of a methodology crisis. Why surveys of prevalence and severity are still needed.\u00a0\u00bb Samuel J. Sender, Mircea Sofonea et Pierre Sonigo \u2013 http:\/\/variances.eu\/?p=6188<\/p>\n<p>&nbsp;<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Depuis le d\u00e9but de la pand\u00e9mie de la Covid-19, beaucoup de statistiques ont \u00e9t\u00e9 utilis\u00e9es dans le d\u00e9bat public pour d\u00e9crire les fluctuations de l\u2019\u00e9pid\u00e9mie et pour justifier les politiques publiques. Ces statistiques ont presque toujours \u00e9t\u00e9 d\u2019origine administrative ou professionnelle. En France, elles proviennent, pour l\u2019essentiel, de l\u2019administration des h\u00f4pitaux, des praticiens de la [&hellip;]<\/p>\n","protected":false},"author":263,"featured_media":6263,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_et_pb_use_builder":"","_et_pb_old_content":"","_et_gb_content_width":"","_exactmetrics_skip_tracking":false,"_exactmetrics_sitenote_active":false,"_exactmetrics_sitenote_note":"","_exactmetrics_sitenote_category":0,"footnotes":""},"categories":[214,18],"tags":[],"class_list":["post-6257","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-coronavirus","category-statistiques","et-has-post-format-content","et_post_format-et-post-format-standard"],"_links":{"self":[{"href":"https:\/\/variances.eu\/index.php?rest_route=\/wp\/v2\/posts\/6257","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/variances.eu\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/variances.eu\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/variances.eu\/index.php?rest_route=\/wp\/v2\/users\/263"}],"replies":[{"embeddable":true,"href":"https:\/\/variances.eu\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=6257"}],"version-history":[{"count":0,"href":"https:\/\/variances.eu\/index.php?rest_route=\/wp\/v2\/posts\/6257\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/variances.eu\/index.php?rest_route=\/wp\/v2\/media\/6263"}],"wp:attachment":[{"href":"https:\/\/variances.eu\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=6257"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/variances.eu\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=6257"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/variances.eu\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=6257"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}