{"id":6874,"date":"2022-09-12T07:10:24","date_gmt":"2022-09-12T05:10:24","guid":{"rendered":"https:\/\/variances.eu\/?p=6874"},"modified":"2022-09-12T07:15:08","modified_gmt":"2022-09-12T05:15:08","slug":"les-biais-les-discriminations-et-lequite-en-assurance","status":"publish","type":"post","link":"https:\/\/variances.eu\/?p=6874","title":{"rendered":"Les biais, les discriminations et l\u2019\u00e9quit\u00e9 en assurance"},"content":{"rendered":"<p><em>Cet article est une version l\u00e9g\u00e8rement modifi\u00e9e de l\u2019introduction du document <span style=\"text-decoration: underline;\"><span style=\"color: #0000ff;\"><a style=\"color: #0000ff; text-decoration: underline;\" href=\"https:\/\/www.institutlouisbachelier.org\/assurance-discrimination-biais-et-equite\/\">Opinions et D\u00e9bats<\/a><\/span><\/span> publi\u00e9 par l\u2019Institut Louis Bachelier au d\u00e9but de l\u2019\u00e9t\u00e9.<\/em><\/p>\n<hr \/>\n<p>Les <strong>donn\u00e9es massives<\/strong> et les performances obtenues par les algorithmes d\u2019<strong>apprentissage automatique<\/strong> ont chamboul\u00e9 l\u2019assurance et l\u2019actuariat. Les questions soulev\u00e9es par ces nouveaux outils dans d\u2019autres contextes (que ce soit la justice pr\u00e9dictive (ou justice \u201cactuarielle\u201d comme l\u2019appelle <span style=\"text-decoration: underline; color: #0000ff;\"><a style=\"color: #0000ff; text-decoration: underline;\" href=\"https:\/\/press.uchicago.edu\/ucp\/books\/book\/chicago\/A\/bo4101022.html\">Harcourt (2008)<\/a><\/span>) ou les d\u00e9bats sur les <em>fake news<\/em>, en passant par les v\u00e9hicules autonomes et la m\u00e9decine pr\u00e9dictive) poussent les actuaires au doute, et \u00e0 la m\u00e9fiance. <span style=\"text-decoration: underline; color: #0000ff;\"><a style=\"color: #0000ff; text-decoration: underline;\" href=\"https:\/\/doi.org\/10.2307\/3105385\">Kranzberg (1986)<\/a> <\/span>affirmait que \u201c<em>technology is neither good nor bad; nor is it neutral\u201d<\/em>, mettant en avant que, m\u00eame sans mauvaises intentions, les algorithmes d\u2019apprentissage pouvaient \u00eatre injustes. Et corriger ces possibles injustices n\u2019est pas simple. Pour <span style=\"text-decoration: underline; color: #0000ff;\"><a style=\"color: #0000ff; text-decoration: underline;\" href=\"https:\/\/www.oreilly.com\/library\/view\/practical-fairness\/9781492075721\/\">Nielsen (2020)<\/a><\/span>, \u201c<em>technology does not necessarily self-regulate, via either market or social pressures<\/em>\u201d (la main invisible des march\u00e9s ou de la pression sociale ne suffira peut \u00eatre pas). C\u2019est dans ce contexte que nous allons revenir ici sur les probl\u00e9matiques de biais, de discrimination et d\u2019\u00e9quit\u00e9, des mod\u00e8les pr\u00e9dictifs utilis\u00e9s en assurance. Ces changements, tant sur les donn\u00e9es que sur les mod\u00e8les, que l\u2019on observe depuis une petite dizaine d\u2019ann\u00e9es, avaient d\u00e9j\u00e0 questionn\u00e9 l\u2019existence m\u00eame de l\u2019assurance.<\/p>\n<p>Pour <span style=\"text-decoration: underline; color: #0000ff;\"><a style=\"color: #0000ff; text-decoration: underline;\" href=\"https:\/\/www.mckinsey.com\/industries\/financial-services\/our-insights\/digital-ecosystems-for-insurers-opportunities-through-the-internet-of-things\">Loffler et M\u00fcnstermann (2016)<\/a><\/span>, \u201c<em>this leads to demutualization and a focus on predicting and managing individual risks rather than communities<\/em>\u201c, l\u2019<strong>individualisation<\/strong> de plus en plus grande des primes force \u00e0 s\u2019interroger sur l\u2019avenir de la <strong>mutualisation<\/strong> et de la <strong>solidarit\u00e9<\/strong> entre assur\u00e9s. Les probl\u00e8mes de discrimination sont alors \u00e0 envisager dans ce contexte de perte de solidarit\u00e9. Car paradoxalement, la discrimination n\u2019a de sens qu\u2019en voyant l\u2019individu en tant que membre d\u2019un groupe caract\u00e9ris\u00e9 par un trait partag\u00e9 (les femmes, les personnes d\u2019origine \u00e9trang\u00e8res, les personnes \u00e2g\u00e9es, etc).<\/p>\n<p>Ce principe de mutualisation des risques se traduit par le fait que l\u2019<strong>assurance<\/strong> est \u201c<em>the contribution of the many to the misfortune of the few\u201d. <\/em>De par l\u2019inversion du cycle de production, l\u2019assureur vend au souscripteur une promesse d\u2019indemnisation, dans le futur, d\u2019un risque al\u00e9atoire, en \u00e9change du paiement d\u2019une contribution \u201cjuste\u201d ou \u201c\u00e9quitable\u201d, a priori proportionnelle au risque de l\u2019assur\u00e9 (<span style=\"text-decoration: underline; color: #0000ff;\"><a style=\"color: #0000ff; text-decoration: underline;\" href=\"https:\/\/link.springer.com\/article\/10.1057\/palgrave.gpp.2510078\">Thiery et al. (2006)<\/a><\/span> parleront d\u2019<strong>\u00e9quit\u00e9 actuarielle<\/strong>). Le vrai facteur de risque sous-jacent \u00e9tant une information non-observable lors de la signature du contrat, l\u2019assureur va construire des <strong>algorithmes pr\u00e9dictifs<\/strong>, \u00e0 partir d\u2019information disponible, pour pr\u00e9dire la fr\u00e9quence de sinistre, le co\u00fbt des sinistres, mais aussi la probabilit\u00e9 de frauder, ou la probabilit\u00e9 de souscrire une garantie suppl\u00e9mentaire par exemple. En ne voyant plus un groupe d\u2019assur\u00e9s comme une mutualit\u00e9 parfaitement homog\u00e8ne, les actuaires ont utilis\u00e9 des algorithmes de plus en plus fins pour cr\u00e9er des sous-groupes davantage homog\u00e8nes. Avec le d\u00e9veloppement des techniques d\u2019<strong>apprentissage machine<\/strong>, l\u2019id\u00e9e de personnalisation, d\u2019individualisation (tr\u00e8s pr\u00e9sente dans la communaut\u00e9 informatique depuis plusieurs ann\u00e9es, comme le soulignaient <span style=\"text-decoration: underline; color: #0000ff;\"><a style=\"color: #0000ff; text-decoration: underline;\" href=\"https:\/\/dl.acm.org\/doi\/10.1145\/1089107.1089109\">Adomavicius et al. (2005)<\/a><\/span> avec des \u201cprofils\u201d individualis\u00e9s) fait son chemin, et pousse les assureurs \u00e0 d\u00e9mutualiser de plus en plus. \u201c<em>At the core of insurance business lies discrimination between risky and non-risky insureds<\/em>\u201d avait affirm\u00e9 <span style=\"text-decoration: underline; color: #0000ff;\"><a style=\"color: #0000ff; text-decoration: underline;\" href=\"https:\/\/papers.ssrn.com\/sol3\/papers.cfm?abstract_id=3089946\">Avraham (2017)<\/a><\/span>. Aussi, d\u2019un c\u00f4t\u00e9, l\u2019op\u00e9ration d\u2019assurance rel\u00e8ve de la technique et a fondamentalement une dimension collective, reposant sur la mutualisation des risques au sein de groupes de risques homog\u00e8nes. Les syst\u00e8mes de classification des assurances reposent sur l\u2019hypoth\u00e8se que les individus r\u00e9pondent aux caract\u00e9ristiques moyennes (<strong>st\u00e9r\u00e9otyp\u00e9es<\/strong> d\u2019une certaine mani\u00e8re) d\u2019un groupe auquel ils appartiennent. C\u2019est la discrimination au sens statistique (mise en \u0153uvre par des outils statistiques puis \u00e9conom\u00e9triques). De plus, le contrat d\u2019assurance rel\u00e8ve du droit, et a une dimension individuelle. En ce sens, un individu ne peut \u00eatre trait\u00e9 diff\u00e9remment en raison de son appartenance \u00e0 tel ou tel groupe, en particulier \u00e0 un groupe auquel il n\u2019a pas choisi d\u2019appartenir, sinon c\u2019est de la discrimination, au sens l\u00e9gal du terme. Et dans le contexte de donn\u00e9es de plus en plus massives, et d\u2019algorithmes pr\u00e9dictifs de plus en plus complexes (pour ne pas utiliser le terme de \u201c<strong>bo\u00eete noire\u201d<\/strong>), il est devenu de plus en plus difficile de garantir que les assureurs demandent une contribution \u201cjuste\u201d aux souscripteurs de polices d\u2019assurance.<\/p>\n<p>R\u00e9fl\u00e9chir aux \u00e9galit\u00e9s de traitement des assur\u00e9s revient \u00e0 s\u2019interroger sur la possibilit\u00e9 m\u00eame de souscrire un contrat, en vue d\u2019une couverture, mais aussi \u00e0 l\u2019id\u00e9e de demander une prime non prohibitive, et non dissuasive. Car contrairement \u00e0 ce que nous apprennent les math\u00e9matiques financi\u00e8res (et l\u2019hypoth\u00e8se de march\u00e9s complets, <span style=\"text-decoration: underline; color: #0000ff;\"><a style=\"color: #0000ff; text-decoration: underline;\" href=\"https:\/\/www.imf.org\/external\/pubs\/ft\/wp\/2001\/wp01174.pdf\">Froot (1995)<\/a><\/span>), il n\u2019existe pas en assurance de <strong>loi du prix unique<\/strong>, le prix d\u2019un risque \u00e9tant vu au travers d\u2019une mutualit\u00e9 d\u2019assur\u00e9s, et d\u2019un mod\u00e8le de tarification. De plus, les souscripteurs n\u2019ach\u00e8tent pas \u201cune assurance\u201d, mais une <strong>garantie<\/strong> de couverture contre certains risques. Si certaines garanties sont souscrites majoritairement par certaines populations, et pas par d\u2019autres, la diff\u00e9rence de prix ne correspond pas forc\u00e9ment \u00e0 une discrimination, <em>stricto sensu<\/em>. C\u2019est dans ce contexte que nous allons discuter des biais, des discriminations et de l\u2019\u00e9quit\u00e9 en assurance.<\/p>\n<p>Les <strong>donn\u00e9es<\/strong>, de plus en plus massives, posent de nombreux d\u00e9fis. Tout d\u2019abord, la r\u00e9glementation cherche \u00e0 prot\u00e9ger des informations dites <strong>sensibles<\/strong> ou <strong>prot\u00e9g\u00e9es<\/strong>, interdisant parfois de collecter et de stocker certaines variables. Le principal danger est qu\u2019il devient alors difficile d\u2019assurer qu\u2019un mod\u00e8le ne discrimine pas suivant un crit\u00e8re, si ce crit\u00e8re n\u2019est pas observ\u00e9. Poser un voile d\u2019ignorance sur certaines caract\u00e9ristiques ne suffit pas pour imposer l\u2019\u00e9quit\u00e9 d\u2019un mod\u00e8le, et ne sert qu\u2019\u00e0 masquer un potentiel probl\u00e8me (ou comme l\u2019affirmaient <span style=\"text-decoration: underline; color: #0000ff;\"><a style=\"color: #0000ff; text-decoration: underline;\" href=\"https:\/\/dl.acm.org\/doi\/10.1145\/3287560.3287592\">Kearns et al. (2019)<\/a><\/span>, \u201c<em>machine learning won<\/em>\u2019<em>t give you anything like gender neutrality <\/em>\u201c<em>for free\u201d <\/em><em>that you didn<\/em>\u2019<em>t explicitly ask for<\/em>\u201c). Un autre d\u00e9fi est celui des innombrables <strong>biais<\/strong> des donn\u00e9es collect\u00e9es \u00e0 travers toutes sortes de sources (questionnaires, objets connect\u00e9s, donn\u00e9es obtenues via diff\u00e9rentes sources, etc). Parmi ces derniers, on peut mentionner les biais de variable manquante, les biais de d\u00e9finition ou d\u2019interpr\u00e9tation, les biais de mesure, les biais de survie, les biais de r\u00e9troaction, etc. Ces \u201c<em>dark data\u201d<\/em> (pour reprendre le terme utilis\u00e9 par <span style=\"text-decoration: underline; color: #0000ff;\"><a style=\"color: #0000ff; text-decoration: underline;\" href=\"https:\/\/press.princeton.edu\/books\/hardcover\/9780691182377\/dark-data\">Hand (2020)<\/a><\/span>) forcent \u00e0 s\u2019interroger sur la pertinence d\u2019une classification des risques, certaines discriminations \u00e9tant parfois per\u00e7ues sur la base d\u2019informations biais\u00e9es, ou mal interpr\u00e9t\u00e9es. Si le genre du conducteur principal d\u2019un v\u00e9hicule a longtemps \u00e9t\u00e9 utilis\u00e9 par les assureurs, on peut s\u2019interroger sur sa signification dans un couple (h\u00e9t\u00e9rosexuel) partageant une voiture. On retrouve ici la difficult\u00e9 de la <strong>d\u00e9<\/strong><strong>finition<\/strong> des variables, bien connue par les statisticiens.<\/p>\n<p>On reviendra ainsi sur le <strong>paradoxe de Simpson<\/strong> et l\u2019inf\u00e9rence \u00e9cologique (en anglais, on parle d\u2019<em>ecological fallacy<\/em>) o\u00f9 l\u2019absence de certaines variables peut donner une interpr\u00e9tation fausse, fallacieuse, sur le sens d\u2019une potentielle discrimination. Et dans le contexte d\u2019assurance, les donn\u00e9es t\u00e9l\u00e9matiques, et les m\u00e9canismes incitatifs de type \u201c<em>gamification\u201d<\/em> posent des questions sur les <strong>biais de r\u00e9<\/strong><strong>troaction<\/strong>, les assureurs ayant la possibilit\u00e9 d\u2019influencer directement les comportements de tels ou tels assur\u00e9s, sur la base de donn\u00e9es arrivant en temps r\u00e9el. On retrouve ici une forme de <strong>biais de s\u00e9lection<\/strong>, ce dernier signifiant simplement que les donn\u00e9es historiques ont \u00e9t\u00e9 collect\u00e9es sur des personnes qui ont choisi de souscrire un contrat et qui ont \u00e9t\u00e9 accept\u00e9es par un assureur au pr\u00e9alable (potentiellement sur la base d\u2019un pr\u00e9c\u00e9dent mod\u00e8le). Tout comme l\u2019analyse de la fraude ne peut pas se faire de la m\u00eame mani\u00e8re, si les enqu\u00eates en lien avec la fraude sont men\u00e9es de mani\u00e8re al\u00e9atoire ou si elle reposent sur un mod\u00e8le pr\u00e9alable de d\u00e9tection de fraude. On retrouve les d\u00e9bats classiques entre les donn\u00e9es d\u2019exp\u00e9riences (souvent <strong>randomis\u00e9es<\/strong>, pour reprendre le terme anglais) et les donn\u00e9es administratives ou observationnelles.<\/p>\n<p>On l\u2019a d\u00e9j\u00e0 mentionn\u00e9, une notion centrale sera celle de <strong>discrimination<\/strong>, terme particuli\u00e8rement ambigu, puisque les actuaires utiliseront la version statistique du terme (on peut penser \u00e0 l\u2019analyse discriminante introduite par Ronald Fisher), alors que les juristes y voient un traitement in\u00e9gal et d\u00e9favorable appliqu\u00e9 \u00e0 certaines personnes en raison de certains crit\u00e8res. M\u00eame s\u2019il existe des diff\u00e9rences culturelles entre les pays, on retrouvera souvent un certain nombre de caract\u00e9ristiques prot\u00e9g\u00e9es (par la <strong>morale<\/strong>, ou par la <strong>loi<\/strong>) comme le genre ou le sexe de la personne, la race ou l\u2019origine nationale ou ethnique, le handicap et toute information g\u00e9n\u00e9tique, etc. Ces crit\u00e8res sont parfois pr\u00e9sent\u00e9s comme des <strong>clubs<\/strong> dans lesquels on tombe \u00e0 la naissance, pour reprendre l\u2019expression de <span style=\"text-decoration: underline; color: #0000ff;\"><a style=\"color: #0000ff; text-decoration: underline;\" href=\"https:\/\/www.cambridge.org\/ca\/academic\/subjects\/sociology\/sociology-general-interest\/age-discrimination-historical-and-contemporary-analysis?format=HB&amp;isbn=9780521847773\">Macnicol (2006)<\/a><\/span> (qui font aussi \u00e9cho au concept de \u201cvoile d\u2019ignorance\u201d et de \u201cloterie g\u00e9n\u00e9tique\u201d). D\u2019autres crit\u00e8res comme l\u2019\u00e2ge sont plus complexes car un assur\u00e9 traversera tous les \u00e2ges au cours de sa vie : s\u2019il y a une \u201cdiscrimination\u201d contre les jeunes, l\u2019assur\u00e9 en souffrira \u00e0 20 ans alors qu\u2019il est dans le groupe d\u00e9favoris\u00e9, avant de passer progressivement dans le groupe privil\u00e9gi\u00e9 (sans \u00e9voquer une possible solidarit\u00e9 inter-g\u00e9n\u00e9rationnelle). Enfin, des crit\u00e8res rel\u00e8vent davantage de choix, plus ou moins conscients. Une premi\u00e8re difficult\u00e9 est que de nombreuses discriminations ne sont pas intentionnelles. Pire encore, contrairement \u00e0 ce qui peut exister dans la litt\u00e9rature traditionnelle sur les discriminations (o\u00f9 des proxys sont potentiellement utilis\u00e9s \u00e0 la place d\u2019une variable sensible, comme le <em>redlining<\/em> o\u00f9 les quartiers d\u2019une ville sont un proxy d\u2019une information \u00e9thique et raciale), en assurance, certaines variables sensibles (comme le genre) ont longtemps \u00e9t\u00e9 utilis\u00e9es comme proxy d\u2019informations difficilement accessibles (comme des informations comportementales en mati\u00e8re de conduite automobile).<\/p>\n<p>Une autre difficult\u00e9 repose sur un probl\u00e8me classique en grande dimension, et sur la multicolin\u00e9arit\u00e9 des variables pr\u00e9dictives. Ceci peut donner lieu \u00e0 une <strong>discrimination par proxy<\/strong> (parfois appel\u00e9e <strong>discrimination statistique<\/strong> ou <strong>discrimination indirecte<\/strong> dans les directives europ\u00e9ennes en lien avec la discrimination), qui consiste \u00e0 utiliser une variable tr\u00e8s corr\u00e9l\u00e9e \u00e0 la variable prot\u00e9g\u00e9e. L\u2019utilisation intensive de proxys (non d\u00e9tect\u00e9es) dans le d\u00e9veloppement de mod\u00e8les a soulev\u00e9 des inqui\u00e9tudes quant \u00e0 l\u2019\u00e9quit\u00e9. Et l\u2019enrichissement de donn\u00e9es rajoute de plus en plus de variables pouvant \u00eatre vues comme engendrant une discrimination indirecte. Cette notion d\u2019<strong>\u00e9quit\u00e9<\/strong> d\u2019un mod\u00e8le pr\u00e9dictif doit \u00eatre rapproch\u00e9e des divers concepts de <strong>justice<\/strong> qui permettent dequantifier l\u2019ampleur d\u2019une possible discrimination. Si on formalise rapidement, on dispose d\u2019un triplet (<em>y<\/em>,<em>x<\/em>,<em>p<\/em>) o\u00f9 <em>y<\/em> est une variable d\u2019int\u00e9r\u00eat (nombre de sinistres, co\u00fbt annuel, nombre de visites chez le m\u00e9decin, etc), <em>x<\/em> un ensemble de variables explicatives admissibles, utilis\u00e9es pour pr\u00e9dire <em>y<\/em>, et <em>p<\/em> est une variable sensible, ou prot\u00e9g\u00e9e (suppos\u00e9e unique, bien souvent<a href=\"#_ftn1\" name=\"_ftnref1\"><sup>[1]<\/sup><\/a>). Construire un mod\u00e8le pr\u00e9dictif en utilisant seulement les variables autoris\u00e9es <em>x <\/em>et pas la variable sensible <em>p<\/em> ne suffit pas \u00e0 garantir que le mod\u00e8le soit \u00ab\u00a0juste\u00a0\u00bb, et que ce dernier ne discrimine pas sur la base de <em>p<\/em>, tout simplement car cette derni\u00e8re peut \u00eatre tr\u00e8s corr\u00e9l\u00e9e \u00e0 certaines caract\u00e9ristiques <em>x <\/em>(on retrouve l\u2019id\u00e9e de proxy). <span style=\"text-decoration: underline; color: #0000ff;\"><a style=\"color: #0000ff; text-decoration: underline;\" href=\"https:\/\/www.californialawreview.org\/wp-content\/uploads\/2016\/06\/2Barocas-Selbst.pdf\">Barocas\u00a0et al.\u00a0(2016)<\/a><\/span> notent que les grands principes associ\u00e9s \u00e0 l\u2019\u00e9quit\u00e9 se traduisent (1) par une ind\u00e9pendance entre la pr\u00e9diction et <em>p<\/em>, autrement dit la pr\u00e9diction n\u2019a rien \u00e0 voir avec le groupe de <em>p <\/em>(2) par une notion de s\u00e9paration : la pr\u00e9diction est ind\u00e9pendante de la variable sensible conditionnellement \u00e0 <em>y<\/em>, et (3) une notion de suffisance : <em>y<\/em> et <em>p<\/em> sont ind\u00e9pendantes, \u00e9tant donn\u00e9 la pr\u00e9diction.<\/p>\n<p>Ces principes vont se traduire par diff\u00e9rentes notions d\u2019\u00e9quit\u00e9 de groupe, les plus populaires \u00e9tant la <strong>parit\u00e9 d\u00e9mographique<\/strong> et la notion d\u2019<strong>\u00e9galit\u00e9 des chances<\/strong>. Ces notions (dites de groupe), tr\u00e8s populaires et largement utilis\u00e9es (par exemple sur le march\u00e9 du travail, aux \u00c9tats-Unis) sont \u00e0 distinguer des approches individuelles qui \u00e9mergent dans la litt\u00e9rature scientifique, inspir\u00e9es des techniques d\u2019inf\u00e9rence causale et visant \u00e0 chercher \u00e0 un <strong>contrefactuel<\/strong> afin de r\u00e9pondre \u00e0 la question <em>que se serait-il pass\u00e9 <\/em><em>si l<\/em>\u2019<em>assur\u00e9 avait la caract\u00e9ristique p=1 au lieu de p=0<\/em> ? (si on suppose que la variable prot\u00e9g\u00e9e est binaire (prenant les valeurs 0 ou 1). C\u2019est une relation <strong>causale<\/strong> entre la variable sensible <em>p<\/em> et la variable de risque <em>y <\/em>qui peut l\u00e9gitimer une discrimination statique, comme le sugg\u00e9rait la Commission Europ\u00e9enne, qui proposait d\u2019autoriser \u201c<em>des diff\u00e9rences proportionnelles dans les primes et les prestations des particuliers lorsque l<\/em>\u2019<em>utilisation du sexe est un <strong>facteur d\u00e9<\/strong><\/em><strong><em>terminant<\/em><\/strong><em> dans l\u2019\u00e9valuation du risque, sur la base de donn\u00e9es actuarielles et statistiques pertinentes et pr\u00e9cises\u201d<\/em>. N\u00e9anmoins, la pr\u00e9sence de proxy pose de nombreux d\u00e9fis, car l\u2019approche contrefactuelle usuelle (consistant \u00e0 changer la variable prot\u00e9g\u00e9e seulement, <em>ceteris paribus<\/em>) n\u2019a pas de sens en grande dimension, en pr\u00e9sence de proxys fortement corr\u00e9l\u00e9s \u00e0 la variable sensible : une intervention (conceptuelle et fictive) sur la variable sensible doit avoir un impact sur une ou plusieurs variables pr\u00e9dictives <em>x<\/em>, et donc sur la pr\u00e9vision.<\/p>\n<p>In\u00e9vitablement, ces notions d\u2019\u00e9quit\u00e9 et de la justice \u00ab\u00a0algorithmiques\u00a0\u00bb soul\u00e8vent des questions importantes sur la <strong>responsabilit\u00e9<\/strong>. En effet, si un algorithme reproduit ce qu\u2019il observe dans les donn\u00e9es, peut-il \u00eatre jug\u00e9 responsable de reproduire les biais sociaux ? Sous un angle \u00e9pist\u00e9mologique, on demandait historiquement aux mod\u00e8le de bien \u201cd\u00e9crire le r\u00e9el\u201d (ou disons le r\u00e9el tel qu\u2019il appara\u00eet dans les donn\u00e9es, on parlera d\u2019<strong><em>accuracy<\/em><\/strong> en apprentissage statistique), c\u2019est-\u00e0-dire \u201cce qui est\u201d, alors qu\u2019en introduisant une dimension morale et \u00e9thique, on demande que le mod\u00e8le soit en accord avec ce qui \u201cdevrait \u00eatre\u201d, suivant une norme \u00e9thique (la fameuse opposition \u201c<em>is-ought\u201d<\/em> de <span style=\"text-decoration: underline; color: #0000ff;\"><a style=\"color: #0000ff; text-decoration: underline;\" href=\"https:\/\/fr.wikipedia.org\/wiki\/Trait%252525C3%252525A9_de_la_nature_humaine\">Hume (1739)<\/a><\/span>), ou entre la \u201cnormalit\u00e9\u201d statistique oppos\u00e9e \u00e0 la norme morale. L\u2019autre souci est que pour quantifier l\u2019\u00e9quit\u00e9, il convient d\u2019avoir acc\u00e8s \u00e0 ces donn\u00e9es personnelles, priv\u00e9es et sensibles, ce qui renvoie aux discussions sur la <strong>vie priv\u00e9e<\/strong> (ou <em>privacy<\/em>) et la <strong>conformit\u00e9<\/strong> (ou <em>compliance<\/em>).<\/p>\n<p>Finalement, ces discussions autour de la discrimination, des biais et de l\u2019\u00e9quit\u00e9 sont tr\u00e8s proches de celles portant sur l\u2019<strong>interpr\u00e9tation<\/strong> des mod\u00e8les pr\u00e9dictifs et de la notion d\u2019<strong>explicabilit\u00e9<\/strong>. Cet aspect <strong>narratif<\/strong> de la construction de mod\u00e8le est important, en particulier lorsque l\u2019on cherche \u00e0 cr\u00e9er des <strong>graphes causaux dirig\u00e9s<\/strong> afin de comprendre les liens entre la variable prot\u00e9g\u00e9e <em>p, <\/em>les possibles variables pr\u00e9dictives <em>x<\/em> et la variable d\u2019int\u00e9r\u00eat <em>y<\/em>. Mais en grande dimension, cet exercice devient vite impossible. En affirmant que \u201c<em>all models are wrong but some models are useful\u201d<\/em>, Georges Box insistait sur l\u2019aspect narratif de la mod\u00e9lisation, sur l\u2019interpr\u00e9tation qui en d\u00e9coule. Une compr\u00e9hension fine des donn\u00e9es et des mod\u00e8les est aujourd\u2019hui indispensable, l\u2019\u00e9poque des calculs froids et objectifs (ou suppos\u00e9s objectifs) des actuaires semblant r\u00e9volue.<\/p>\n<hr \/>\n<p><a href=\"#_ftnref1\" name=\"_ftn1\"><sup>[1]<\/sup><\/a> Comme le racontait Coluche, dans le sketch du <span style=\"text-decoration: underline; color: #0000ff;\"><a style=\"color: #0000ff; text-decoration: underline;\" href=\"https:\/\/dai.ly\/x20470t\">blouson noir<\/a><\/span>, \u00ab\u00a0<em>Dieu a dit : il y aura des hommes blancs, il y aura des hommes noirs, il y aura des hommes grands, il y aura des hommes petits, il y aura des hommes beaux et il y aura des hommes moches, et tous seront \u00e9gaux <\/em><em>; mais \u00e7a sera pas facile&#8230; Et puis il a ajout\u00e9 : il y en aura m\u00eame qui seront noirs, petits et moches et pour eux, ce sera tr<\/em><em>\u00e8s dur<\/em>\u00a0\u00bb.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Cet article est une version l\u00e9g\u00e8rement modifi\u00e9e de l\u2019introduction du document Opinions et D\u00e9bats publi\u00e9 par l\u2019Institut Louis Bachelier au d\u00e9but de l\u2019\u00e9t\u00e9. Les donn\u00e9es massives et les performances obtenues par les algorithmes d\u2019apprentissage automatique ont chamboul\u00e9 l\u2019assurance et l\u2019actuariat. Les questions soulev\u00e9es par ces nouveaux outils dans d\u2019autres contextes (que ce soit la justice [&hellip;]<\/p>\n","protected":false},"author":16,"featured_media":6875,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_et_pb_use_builder":"","_et_pb_old_content":"","_et_gb_content_width":"","_exactmetrics_skip_tracking":false,"_exactmetrics_sitenote_active":false,"_exactmetrics_sitenote_note":"","_exactmetrics_sitenote_category":0,"footnotes":""},"categories":[141],"tags":[],"class_list":["post-6874","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-assurance","et-has-post-format-content","et_post_format-et-post-format-standard"],"_links":{"self":[{"href":"https:\/\/variances.eu\/index.php?rest_route=\/wp\/v2\/posts\/6874","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/variances.eu\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/variances.eu\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/variances.eu\/index.php?rest_route=\/wp\/v2\/users\/16"}],"replies":[{"embeddable":true,"href":"https:\/\/variances.eu\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=6874"}],"version-history":[{"count":0,"href":"https:\/\/variances.eu\/index.php?rest_route=\/wp\/v2\/posts\/6874\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/variances.eu\/index.php?rest_route=\/wp\/v2\/media\/6875"}],"wp:attachment":[{"href":"https:\/\/variances.eu\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=6874"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/variances.eu\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=6874"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/variances.eu\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=6874"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}