{"id":8501,"date":"2025-01-20T07:20:46","date_gmt":"2025-01-20T06:20:46","guid":{"rendered":"https:\/\/variances.eu\/?p=8501"},"modified":"2025-01-20T07:20:46","modified_gmt":"2025-01-20T06:20:46","slug":"leconomie-racontee-par-les-donnees-bancaires-partie-1-ce-que-nos-releves-de-comptes-disent-de-nous","status":"publish","type":"post","link":"https:\/\/variances.eu\/?p=8501","title":{"rendered":"L\u2019\u00e9conomie racont\u00e9e par les donn\u00e9es bancaires &#8211; Partie 1 : Ce que nos relev\u00e9s de comptes disent de nous"},"content":{"rendered":"<p><em>Variances remercie les deux auteurs et l\u2019Insee pour cet article en deux volets tir\u00e9 du Courrier des Statistiques de d\u00e9cembre 2024\u00a0: <\/em><span style=\"text-decoration: underline; color: #0000ff;\"><a style=\"color: #0000ff;\" href=\"https:\/\/www.insee.fr\/fr\/information\/8264558?sommaire=8264562\"><em>L\u2019\u00e9conomie racont\u00e9e par les donn\u00e9es bancaires \u2212 Courrier des statistiques N12\u00a0&#8211;\u00a02024 | Insee<\/em><\/a><\/span><\/p>\n<p><em>Avertissement : l\u2019article original a \u00e9t\u00e9 scind\u00e9 en deux parties pour publication dans Variances. Ci-dessous, la partie relative au traitement au sein des banques. Le second volet couvrira le traitement des statisticiens.<\/em><\/p>\n<p><strong>Depuis la crise sanitaire en 2020, l\u2019Insee b\u00e9n\u00e9ficie d\u2019un acc\u00e8s \u00e0 des \u00e9chantillons anonymis\u00e9s de comptes bancaires de La Banque Postale et du Cr\u00e9dit Mutuel Alliance F\u00e9d\u00e9rale. Ces donn\u00e9es, riches en informations, ont permis de documenter l\u2019\u00e9volution de la situation financi\u00e8re des m\u00e9nages en temps r\u00e9el lors de la crise in\u00e9dite de la Covid-19, puis lors de l\u2019\u00e9pisode inflationniste en 2022. Elles ont \u00e9galement permis de documenter la situation quotidienne des m\u00e9nages, mettant en lumi\u00e8re des \u00e9pisodes de d\u00e9couvert en fin de mois, et d\u2019\u00e9valuer une politique publique en mesurant les impacts financiers, distributifs et environnementaux de la remise \u00e0 la pompe instaur\u00e9e en 2022 \u00e0 la suite de la hausse des prix du carburant.<\/strong><\/p>\n<p><strong>Les donn\u00e9es bancaires sont une mine d\u2019informations pr\u00e9cieuses, mais leur utilisation soul\u00e8ve de nombreux d\u00e9fis. Apr\u00e8s quatre ann\u00e9es d\u2019utilisation, un premier bilan de leur exploitation est propos\u00e9 dans cet article. Comment construire des concepts qui ont un sens \u00e9conomique \u00e0 partir de ces donn\u00e9es\u00a0? Comment s\u2019assurer de leur repr\u00e9sentativit\u00e9\u00a0? Quels sont les apports de ces donn\u00e9es pour la statistique publique\u00a0? Si elles ne permettent pas de remplacer les donn\u00e9es d\u2019enqu\u00eates et fiscales, elles compl\u00e8tent les analyses conjoncturelles. En outre, elles permettent de r\u00e9pondre \u00e0 des questions anciennes sur la consommation et l\u2019\u00e9pargne des m\u00e9nages auxquelles les sources traditionnelles ne pouvaient apporter de r\u00e9ponses. Dans cet article, sont d\u00e9taill\u00e9s les enjeux et les difficult\u00e9s pour utiliser des donn\u00e9es qui proviennent d\u2019acteurs priv\u00e9s et n\u2019ont pas \u00e9t\u00e9 produites \u00e0 des fins statistiques, mais \u00e0 des fins de gestion par les banques.<\/strong><\/p>\n<p>Les relev\u00e9s de comptes bancaires en disent beaucoup sur nos vies. Lorsque les fins de mois sont difficiles, les soldes des comptes sont au plus bas et les d\u00e9couverts plus fr\u00e9quents. Lorsque nous perdons notre emploi, un virement r\u00e9gulier de salaire peut \u00eatre remplac\u00e9 par un virement de France Travail. M\u00eame les d\u00e9parts en vacances ne passent pas inaper\u00e7us\u00a0; les d\u00e9penses de transport et d\u2019h\u00e9bergement augmentent, de m\u00eame que les d\u00e9penses r\u00e9alis\u00e9es \u00e0 l\u2019\u00e9tranger. Les donn\u00e9es bancaires, tr\u00e8s riches en information, permettent donc des exploitations vari\u00e9es.<\/p>\n<p>Dans le premier volet de l\u2019article, nous reviendrons d\u2019abord sur le contexte qui a permis l\u2019acc\u00e8s de l\u2019Insee \u00e0 ces donn\u00e9es\u00a0; le mouvement d\u2019ouverture vers des donn\u00e9es d\u2019origine priv\u00e9e a \u00e9t\u00e9 acc\u00e9l\u00e9r\u00e9 par la crise sanitaire. Ensuite, nous expliciterons comment ces donn\u00e9es sont produites \u00e0 partir des transactions des clients<\/p>\n<h3>Une aubaine pour d\u00e9crire la situation financi\u00e8re des m\u00e9nages pendant la crise sanitaire<\/h3>\n<p>En 2020, la crise sanitaire et le confinement \u00e0 grande \u00e9chelle de la population ont provoqu\u00e9 un choc sur l\u2019\u00e9conomie aussi soudain qu\u2019in\u00e9dit. \u00c0 l\u2019Insee, le suivi de la conjoncture en a \u00e9t\u00e9 boulevers\u00e9, conduisant notamment au recours accru \u00e0 des donn\u00e9es nouvelles, plus rapidement disponibles que les donn\u00e9es traditionnelles (<span style=\"text-decoration: underline; color: #0000ff;\"><a style=\"color: #0000ff; text-decoration: underline;\" href=\"https:\/\/blog.insee.fr\/nouvelles-donnees-pour-suivre-la-conjoncture-economique-pendant-la-crise-sanitaire-quelles-avancees-quelles-suites\/\">Pouget, 2020<\/a><\/span>). Parmi les nouvelles sources mobilis\u00e9es, les donn\u00e9es de comptes bancaires se sont av\u00e9r\u00e9es pr\u00e9cieuses car tr\u00e8s d\u00e9taill\u00e9es et rapidement disponibles. Pour l\u2019Insee, ces donn\u00e9es offraient une r\u00e9elle opportunit\u00e9 pour conforter et enrichir les informations provenant des sources traditionnelles d\u2019enqu\u00eate avant que les donn\u00e9es de sources fiscales ne soient disponibles. En outre, elles permettaient d\u2019\u00e9clairer la situation financi\u00e8re des m\u00e9nages sous un jour nouveau, gr\u00e2ce \u00e0 des indicateurs atypiques pour la statistique publique mais tr\u00e8s parlants pour le grand public, comme les montants pr\u00e9sents sur les comptes en fin de mois ou la proportion de m\u00e9nages \u00e0 d\u00e9couvert.<\/p>\n<p>L\u2019int\u00e9r\u00eat de l\u2019Insee pour ces donn\u00e9es s\u2019est concr\u00e9tis\u00e9 lorsque certaines banques, dans le contexte de la crise sanitaire, ont souhait\u00e9 contribuer \u00e0 l\u2019analyse de la situation \u00e9conomique par la statistique publique. Cr\u00e9dit Mutuel Alliance F\u00e9d\u00e9rale (CMAF) a ainsi permis un acc\u00e8s s\u00e9curis\u00e9 \u00e0 des donn\u00e9es anonymis\u00e9es de comptes bancaires d\u2019un \u00e9chantillon de sa client\u00e8le d\u00e8s 2020<a href=\"#_ftn1\" name=\"_ftnref1\">[1]<\/a>. Des premi\u00e8res \u00e9tudes sur l\u2019\u00e9volution de la situation financi\u00e8re des m\u00e9nages pendant la crise sanitaire ont r\u00e9sult\u00e9 de cette collaboration (<span style=\"text-decoration: underline; color: #0000ff;\"><a style=\"color: #0000ff; text-decoration: underline;\" href=\"https:\/\/www.insee.fr\/fr\/statistiques\/5232043\">Insee Note de conjoncture, 2021<\/a><\/span>). Cependant, utiliser des donn\u00e9es provenant d\u2019un seul r\u00e9seau bancaire pouvait \u00eatre insuffisant pour d\u00e9crire l\u2019ensemble de la population. La client\u00e8le de CMAF \u00e9tant plus ais\u00e9e que la moyenne, ces donn\u00e9es pouvaient notamment s\u2019av\u00e9rer inad\u00e9quates pour documenter la situation financi\u00e8re des plus fragiles. Or, le sujet \u00e9tait br\u00fblant \u00e0 l\u2019\u00e9poque, en plein c\u0153ur de la crise sanitaire. L\u2019Insee a pris contact avec un second r\u00e9seau : La Banque Postale (LBP). Il s\u2019agit de l\u2019\u00e9tablissement le plus \u00e0 m\u00eame de fournir des informations sur les clients bancaris\u00e9s les plus fragiles, car le l\u00e9gislateur lui a confi\u00e9 une mission d\u2019accessibilit\u00e9 bancaire. Les informations de cette banque ont permis de montrer la stabilit\u00e9 des revenus, malgr\u00e9 la crise, y compris pour les plus modestes. Cela a confort\u00e9 les estimations obtenues par le mod\u00e8le de microsimulation Ines<a href=\"#_ftn2\" name=\"_ftnref2\">[2]<\/a> qui concluait \u00e0 un taux de pauvret\u00e9 stable. Ce constat, \u00e0 rebours des discours publics<a href=\"#_ftn3\" name=\"_ftnref3\">[3]<\/a>, rendait le recours \u00e0 des donn\u00e9es externes particuli\u00e8rement pr\u00e9cieux pour convaincre de la solidit\u00e9 des r\u00e9sultats obtenus avec les m\u00e9thodes usuelles (<span style=\"text-decoration: underline; color: #0000ff;\"><a style=\"color: #0000ff; text-decoration: underline;\" href=\"http:\/\/www.constructif.fr\/bibliotheque\/2022-6\/crise-covid-et-mesure-de-la-pauvrete.html?item_id=6819\">Tavernier, 2022<\/a><\/span>). Ainsi, la publication sur les donn\u00e9es LBP a \u00e9t\u00e9 programm\u00e9e le m\u00eame jour que la publication annuelle portant sur le taux de pauvret\u00e9, soit une dizaine de jours avant la journ\u00e9e mondiale de la pauvret\u00e9.<\/p>\n<p>La crise inflationniste succ\u00e9dant \u00e0 la crise sanitaire, les donn\u00e9es bancaires ont de nouveau \u00e9t\u00e9 mobilis\u00e9es afin d\u2019\u00e9clairer l\u2019\u00e9volution de la situation financi\u00e8re des m\u00e9nages dans ce nouveau contexte en 2022 et 2023.<\/p>\n<h3><strong>Une nouvelle utilisation de \u00ab\u00a0big data\u00a0\u00bb priv\u00e9es dans la statistique publique<\/strong><\/h3>\n<p>Si l\u2019acc\u00e8s aux donn\u00e9es bancaires a \u00e9t\u00e9 acc\u00e9l\u00e9r\u00e9 par la crise sanitaire, il s\u2019inscrit dans un contexte plus large d\u2019utilisation par les instituts nationaux de statistiques de nouvelles donn\u00e9es massives d\u2019origine priv\u00e9e, comme les donn\u00e9es de caisse (<span style=\"text-decoration: underline; color: #0000ff;\"><a style=\"color: #0000ff; text-decoration: underline;\" href=\"https:\/\/www.insee.fr\/fr\/information\/4254225?sommaire=4254170\">Leclair, 2019<\/a><\/span>). Ces donn\u00e9es, appel\u00e9es commun\u00e9ment \u00ab\u00a0big data\u00a0\u00bb, peuvent inclure des informations aussi vari\u00e9es que celles d\u2019annonces de logements, de t\u00e9l\u00e9phonie mobile ou de compteurs de gaz et d\u2019\u00e9lectricit\u00e9. Ces donn\u00e9es procurent de nombreux avantages par rapport aux sources usuelles comme la haute fr\u00e9quence ou la granularit\u00e9 (<span style=\"text-decoration: underline; color: #0000ff;\"><a style=\"color: #0000ff; text-decoration: underline;\" href=\"https:\/\/www.annales.org\/enjeux-numeriques\/2018\/en_02_06_18.html\">Blanchet et Givord, 2018<\/a><\/span>). Mais il existe \u00e9galement de nombreux obstacles dans leur utilisation. Outre les enjeux de repr\u00e9sentativit\u00e9, ces donn\u00e9es sont peu structur\u00e9es, et leurs exploitations n\u00e9cessitent donc d\u2019importants investissements.<\/p>\n<p>Avant d\u2019\u00eatre transform\u00e9e en information utile au d\u00e9bat public, la donn\u00e9e bancaire subit de nombreux traitements, du terminal de paiement aux tableaux ou graphiques des publications, en passant par les syst\u00e8mes d\u2019information des banques. Ce long chemin n\u2019est pas propre aux donn\u00e9es bancaires ou aux donn\u00e9es priv\u00e9es et fait \u00e9cho aux traitements r\u00e9alis\u00e9s lors d\u2019utilisation de donn\u00e9es administratives (<span style=\"text-decoration: underline; color: #0000ff;\"><a style=\"color: #0000ff; text-decoration: underline;\" href=\"https:\/\/www.insee.fr\/fr\/information\/7635829?sommaire=7635842\">Cotton et Haag, 2023<\/a><\/span>), par exemple celles de propri\u00e9t\u00e9s immobili\u00e8res (<span style=\"text-decoration: underline; color: #0000ff;\"><a style=\"color: #0000ff; text-decoration: underline;\" href=\"https:\/\/www.insee.fr\/fr\/information\/6035944?sommaire=6035950\">Andr\u00e9 et Meslin, 2022<\/a><\/span>).<\/p>\n<p>Nous allons d\u00e9crire ce parcours de la donn\u00e9e et les retraitements r\u00e9alis\u00e9s par la banque puis par le statisticien.<\/p>\n<h3>Parcours de la donn\u00e9e bancaire\u00a0: du syst\u00e8me de gestion priv\u00e9 \u00e0 une meilleure compr\u00e9hension des comportements \u00e9conomiques<\/h3>\n<p>L\u2019exploitation des donn\u00e9es bancaires repose sur des partenariats \u00e9troits avec les banques. Le statisticien public ne se contente pas de r\u00e9cup\u00e9rer et d\u2019exploiter une base pr\u00e9existante, il doit la construire progressivement et conjointement avec le partenaire bancaire. L\u2019objectif est de transformer des donn\u00e9es issues des processus de gestion de comptes bancaires en des tables de donn\u00e9es individuelles agr\u00e9g\u00e9es au niveau m\u00e9nage. Cette entreprise n\u00e9cessite de nombreux \u00e9changes avec les banques. D\u2019un c\u00f4t\u00e9, le statisticien doit expliciter ses besoins, de l\u2019autre la banque doit d\u00e9tailler le contour des donn\u00e9es qu\u2019elle peut mettre \u00e0 disposition. Les donn\u00e9es s\u2019enrichissent au fur et \u00e0 mesure du partenariat au gr\u00e9 des besoins du statisticien et des contraintes des banques (<em>encadr\u00e9\u00a01<\/em>).<\/p>\n<div style=\"width: auto; border: 1px solid #2E86C1; text-align: justify; background: #F0F0F0; padding: 10px;\">\n<h5>Encadr\u00e9 1. Des partenariats \u00e9troits avec les banques qui facilitent la mont\u00e9e en puissance de l\u2019utilisation des donn\u00e9es bancaires \u00e0 des fins statistiques<\/h5>\n<p>Des \u00e9changes r\u00e9guliers avec les banques ont permis \u00e0 l\u2019Insee d\u2019am\u00e9liorer significativement l\u2019exploitabilit\u00e9 des donn\u00e9es depuis le d\u00e9but du partenariat. Ces collaborations \u00e9troites se sont d\u2019ailleurs traduites par des co-publications avec les banques (de l\u2019Insee avec La Banque Postale et du Conseil d\u2019Analyse \u00c9conomique (CAE) avec Cr\u00e9dit Mutuel Alliance F\u00e9d\u00e9rale).<\/p>\n<p>Les partenariats avec les banques ont \u00e9galement conduit \u00e0 des projets d\u2019exp\u00e9riences al\u00e9atoires sur certains clients. L&rsquo;Insee m\u00e8ne actuellement une exp\u00e9rimentation en collaboration avec La Banque Postale, dans le but d&rsquo;\u00e9valuer un dispositif d&rsquo;accompagnement budg\u00e9taire, qui s\u2019inscrit dans le cadre de la mission publique d\u2019accessibilit\u00e9 bancaire de La Banque Postale, destin\u00e9 aux clients en situation de fragilit\u00e9 financi\u00e8re. Le CAE a \u00e9galement estim\u00e9 des propensions marginales \u00e0 consommer, c\u2019est-\u00e0-dire les montants d\u00e9pens\u00e9s par les m\u00e9nages qui b\u00e9n\u00e9ficient d\u2019une hausse de revenu, \u00e0 partir d\u2019une exp\u00e9rience sur des clients du CMAF (<span style=\"text-decoration: underline; color: #0000ff;\"><a style=\"color: #0000ff; text-decoration: underline;\" href=\"https:\/\/jmboehm.github.io\/Helicopter.pdf\">Boehm et alii, 2023<\/a><\/span>).<\/p>\n<p>Apparier \u00e0 d\u2019autres sources (tout en pr\u00e9servant l\u2019anonymat) peut ouvrir d\u2019autres perspectives d\u2019\u00e9tudes : gr\u00e2ce \u00e0 un appariement avec des donn\u00e9es publiques de diagnostic de performance \u00e9nerg\u00e9tique (DPE)*, le CAE a \u00e9tudi\u00e9 la performance \u00e9nerg\u00e9tique des logements (<span style=\"text-decoration: underline; color: #0000ff;\"><a style=\"color: #0000ff; text-decoration: underline;\" href=\"https:\/\/www.cae-eco.fr\/performance-energetique-du-logement-et-consommation-d-energie-les-enseignements-des-donnees-bancaires\">Astier et alii, 2024<\/a><\/span>). Au Danemark, des chercheurs ont \u00e9galement \u00e9tudi\u00e9 la r\u00e9action des m\u00e9nages lors d\u2019une perte d\u2019emploi en appariant les donn\u00e9es bancaires des clients d\u2019une grande banque danoise avec les donn\u00e9es sur leurs employeurs** (Andersen et alii, 2023).<\/p>\n<p><em>* Appariement r\u00e9alis\u00e9 par la banque \u00e0 partir de l\u2019adresse des clients.<br \/>\n** L\u2019appariement repose sur une identification de l\u2019employeur par le compte bancaire utilis\u00e9 pour verser les salaires.<\/em><\/p>\n<\/div>\n<h3><\/h3>\n<h3>Du c\u00f4t\u00e9 de la banque\u00a0: des donn\u00e9es de gestion priv\u00e9es aux bases de donn\u00e9es statistiques<\/h3>\n<h5>D\u2019o\u00f9 viennent les donn\u00e9es bancaires\u00a0?<\/h5>\n<p>Chaque jour, des millions d\u2019op\u00e9rations bancaires ont lieu. Toutes ces op\u00e9rations sont enregistr\u00e9es par le syst\u00e8me d\u2019information bancaire afin que l\u2019argent circule entre les comptes des m\u00e9nages et des entreprises. Une transaction bancaire g\u00e9n\u00e8re un flux de donn\u00e9es entre la banque \u00e9mettrice et la banque acqu\u00e9reur, en passant par plusieurs interm\u00e9diaires (<em>figure\u00a01<\/em>). Par exemple, lors d&rsquo;un paiement par carte chez un commer\u00e7ant, le traitement du paiement se d\u00e9roule g\u00e9n\u00e9ralement en trois \u00e9tapes\u00a0: l&rsquo;autorisation, la compensation et le r\u00e8glement. La phase d&rsquo;autorisation a lieu au moment o\u00f9 le client ins\u00e8re sa carte dans le terminal de paiement du magasin. La banque du commer\u00e7ant (banque acqu\u00e9reur) interroge alors la banque du client (banque \u00e9mettrice) via le r\u00e9seau de cartes pour savoir si la transaction est approuv\u00e9e. La banque \u00e9mettrice renvoie ensuite une r\u00e9ponse, positive ou n\u00e9gative, qui parvient jusqu&rsquo;au terminal de paiement et qui permet de valider ou refuser l&rsquo;op\u00e9ration. En fin de journ\u00e9e, le commer\u00e7ant transf\u00e8re \u00e0 sa banque un fichier r\u00e9capitulant toutes les transactions enregistr\u00e9es (d\u00e9but de l&rsquo;\u00e9tape de compensation). Celle-ci regroupe les informations pour l&rsquo;ensemble de ses clients et les transmet \u00e0 la banque \u00e9mettrice, par l&rsquo;interm\u00e9diaire du r\u00e9seau de cartes, afin de pr\u00e9parer l&rsquo;\u00e9tape de r\u00e8glement. Lors de cette derni\u00e8re \u00e9tape, trois r\u00e8glements ont lieu (de mani\u00e8re ind\u00e9pendante, et pas n\u00e9cessairement dans cet ordre)\u00a0: la banque acqu\u00e9reur re\u00e7oit les fonds de la banque \u00e9mettrice, verse le montant d\u00fb au commer\u00e7ant, tandis que la banque \u00e9mettrice d\u00e9bite le compte du client.<\/p>\n<p>Au-del\u00e0 de ces flux, les banques collectent \u00e9galement des variables sociod\u00e9mographiques afin de mieux conna\u00eetre leur client\u00e8le (profession, nombre d\u2019enfants par exemple). Cela leur permet de proposer des services ad\u00e9quats. Ces informations sont traditionnellement collect\u00e9es lors des rendez-vous avec les conseillers en agence mais \u00e9galement de plus en plus via des questionnaires envoy\u00e9s par courriel.<\/p>\n<p style=\"text-align: center;\"><strong>Figure 1 &#8211; Repr\u00e9sentation des flux de donn\u00e9es\u00a0: du client de la banque jusqu&rsquo;au statisticien<\/strong><\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter size-full wp-image-8503\" src=\"https:\/\/variances.eu\/wp-content\/uploads\/2025\/01\/f1.png\" alt=\"\" width=\"626\" height=\"920\" srcset=\"https:\/\/variances.eu\/wp-content\/uploads\/2025\/01\/f1.png 626w, https:\/\/variances.eu\/wp-content\/uploads\/2025\/01\/f1-204x300.png 204w, https:\/\/variances.eu\/wp-content\/uploads\/2025\/01\/f1-600x882.png 600w\" sizes=\"(max-width: 626px) 100vw, 626px\" \/><\/p>\n<h3>S\u00e9lection et transformation des donn\u00e9es pour r\u00e9pondre aux besoins de la statistique publique<\/h3>\n<p>De mani\u00e8re it\u00e9rative, \u00e0 la suite de nombreux \u00e9changes visant \u00e0 clarifier les donn\u00e9es disponibles et l\u2019expression des besoins de l\u2019Insee, la banque s\u00e9lectionne les donn\u00e9es pertinentes, les anonymise et les transforme selon les \u00e9tapes suivantes.<\/p>\n<p>Tout d\u2019abord, la banque op\u00e8re une s\u00e9lection des tables et des variables. Au sein de la masse de donn\u00e9es stock\u00e9es au sein de la banque \u00e0 des fins de gestion (des centaines, voire des milliers de tables contenant chacune quelques dizaines de variables), la banque s\u00e9lectionne les informations sur les transactions, les soldes, les cr\u00e9dits, les incidents bancaires, ainsi que les caract\u00e9ristiques sociod\u00e9mographiques de ses clients. Les donn\u00e9es sont fig\u00e9es un mois donn\u00e9, il arrive donc qu\u2019il manque certaines transactions remontant avec un d\u00e9lai, notamment celles effectu\u00e9es les derniers jours du mois.<\/p>\n<p>Ensuite, la banque proc\u00e8de au tirage d&rsquo;un \u00e9chantillon. Une fois ces tables et variables rassembl\u00e9es, la banque tire un \u00e9chantillon de clients \u00e0 mettre \u00e0 disposition selon une m\u00e9thodologie pr\u00e9alablement d\u00e9finie. Cette op\u00e9ration d\u2019\u00e9chantillonnage qui est monnaie courante dans la statistique publique est rare dans le monde bancaire. Le tirage se fait uniquement sur les clients dont la banque estime h\u00e9berger les revenus et la majorit\u00e9 des op\u00e9rations de consommation.<\/p>\n<p>Puis la banque op\u00e8re l\u2019anonymisation des donn\u00e9es. L\u2019anonymisation (<em>figure\u00a02<\/em>) implique la suppression de variables identifiantes comme le(s) nom(s) et adresse des clients mais \u00e9galement le(s) nom(s) d\u2019\u00e9metteurs et les libell\u00e9s des virements. Or, ces derni\u00e8res variables sont utiles pour les analyses puisqu\u2019elles permettent de rep\u00e9rer les salaires per\u00e7us par les clients, mais aussi les prestations sociales, les allocations ch\u00f4mage, les pensions de retraites, etc. Avant la suppression, la banque extrait donc les informations utiles et non identifiantes de ces variables (type d\u2019\u00e9metteur, r\u00e9gularit\u00e9 de l\u2019\u00e9metteur, libell\u00e9 contenant des mots-cl\u00e9s comme \u00ab salaire \u00bb, etc.). Il s\u2019agit d\u2019un compromis qui permet de garantir l\u2019anonymat des clients, tout en limitant la perte d\u2019information (<span style=\"text-decoration: underline; color: #0000ff;\"><a style=\"color: #0000ff; text-decoration: underline;\" href=\"https:\/\/www.insee.fr\/fr\/information\/7635823?sommaire=7635842\">Redor, 2023<\/a><\/span>).<\/p>\n<p>Enfin, la banque op\u00e8re le transfert des donn\u00e9es. Elle transmet les donn\u00e9es et les m\u00e9tadonn\u00e9es \u00e0 l\u2019Insee dans des environnements s\u00e9curis\u00e9s, au format CSV via le Centre d\u2019Acc\u00e8s S\u00e9curis\u00e9 aux Donn\u00e9es (CASD) pour LBP, et sous la forme d\u2019une base de donn\u00e9es relationnelle via une machine virtuelle pour CMAF.<\/p>\n<p style=\"text-align: center;\"><strong>Figure 2 &#8211; L&rsquo;anonymisation des donn\u00e9es<\/strong><\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter size-full wp-image-8504\" src=\"https:\/\/variances.eu\/wp-content\/uploads\/2025\/01\/f2.png\" alt=\"\" width=\"619\" height=\"633\" srcset=\"https:\/\/variances.eu\/wp-content\/uploads\/2025\/01\/f2.png 619w, https:\/\/variances.eu\/wp-content\/uploads\/2025\/01\/f2-293x300.png 293w, https:\/\/variances.eu\/wp-content\/uploads\/2025\/01\/f2-600x614.png 600w\" sizes=\"(max-width: 619px) 100vw, 619px\" \/><\/p>\n<p>&nbsp;<\/p>\n<p><em>Mots cl\u00e9s : Insee &#8211; Statistiques &#8211; Banques -Big data &#8211; \u00c9pargne &#8211; Revenu<\/em><\/p>\n<hr \/>\n<p><a href=\"#_ftnref1\" name=\"_ftn1\">[1]<\/a> Le Conseil d&rsquo;analyse \u00e9conomique (CAE) a demand\u00e9 et obtenu un acc\u00e8s \u00e0 des donn\u00e9es anonymis\u00e9es de Cr\u00e9dit Mutuel Alliance F\u00e9d\u00e9rale. \u00c0 la suite de ce partenariat, l\u2019Insee a formul\u00e9 la m\u00eame demande.<\/p>\n<p><a href=\"#_ftnref2\" name=\"_ftn2\">[2]<\/a><span style=\"text-decoration: underline; color: #0000ff;\"><a style=\"color: #0000ff;\" href=\"https:\/\/www.insee.fr\/fr\/information\/2021951\"><em> https:\/\/www.insee.fr\/fr\/information\/2021951<\/em><\/a><\/span>.<\/p>\n<p><a href=\"#_ftnref3\" name=\"_ftn3\">[3]<\/a> Pendant la crise sanitaire de la Covid, le chiffre d\u2019un \u00ab million de pauvres suppl\u00e9mentaires \u00bb \u00e9tait repris dans la presse (Le Monde, 2020). Ce chiffrage provenait d\u2019associations caritatives. Les outils d\u00e9ploy\u00e9s par la statistique publique pour mesurer le taux de pauvret\u00e9 (finalement stable en 2020) sont d\u00e9taill\u00e9s par la suite (Tavernier, 2022).<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Variances remercie les deux auteurs et l\u2019Insee pour cet article en deux volets tir\u00e9 du Courrier des Statistiques de d\u00e9cembre 2024\u00a0: L\u2019\u00e9conomie racont\u00e9e par les donn\u00e9es bancaires \u2212 Courrier des statistiques N12\u00a0&#8211;\u00a02024 | Insee Avertissement : l\u2019article original a \u00e9t\u00e9 scind\u00e9 en deux parties pour publication dans Variances. Ci-dessous, la partie relative au traitement au [&hellip;]<\/p>\n","protected":false},"author":511,"featured_media":8509,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_et_pb_use_builder":"","_et_pb_old_content":"","_et_gb_content_width":"","_exactmetrics_skip_tracking":false,"_exactmetrics_sitenote_active":false,"_exactmetrics_sitenote_note":"","_exactmetrics_sitenote_category":0,"footnotes":""},"categories":[159],"tags":[],"class_list":["post-8501","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-insee","et-has-post-format-content","et_post_format-et-post-format-standard"],"_links":{"self":[{"href":"https:\/\/variances.eu\/index.php?rest_route=\/wp\/v2\/posts\/8501","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/variances.eu\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/variances.eu\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/variances.eu\/index.php?rest_route=\/wp\/v2\/users\/511"}],"replies":[{"embeddable":true,"href":"https:\/\/variances.eu\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=8501"}],"version-history":[{"count":5,"href":"https:\/\/variances.eu\/index.php?rest_route=\/wp\/v2\/posts\/8501\/revisions"}],"predecessor-version":[{"id":8517,"href":"https:\/\/variances.eu\/index.php?rest_route=\/wp\/v2\/posts\/8501\/revisions\/8517"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/variances.eu\/index.php?rest_route=\/wp\/v2\/media\/8509"}],"wp:attachment":[{"href":"https:\/\/variances.eu\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=8501"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/variances.eu\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=8501"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/variances.eu\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=8501"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}