{"id":7832,"date":"2024-01-11T07:10:05","date_gmt":"2024-01-11T06:10:05","guid":{"rendered":"https:\/\/variances.eu\/?p=7832"},"modified":"2024-01-12T07:44:26","modified_gmt":"2024-01-12T06:44:26","slug":"intelligence-artificielle-et-ethique-en-assurance-une-nouvelle-solution-pour-attenuer-la-discrimination-en-modelisation-du-risque","status":"publish","type":"post","link":"https:\/\/variances.eu\/?p=7832","title":{"rendered":"Intelligence Artificielle et \u00e9thique en assurance : une nouvelle solution pour att\u00e9nuer la discrimination en mod\u00e9lisation du risque"},"content":{"rendered":"<h3>CONCEPTS ET REGLEMENTATION AUTOUR DE LA DISCRIMINATION<\/h3>\n<p>L\u2019\u00e9quit\u00e9 actuarielle est un concept cl\u00e9 pour les assureurs, qui signifie que les individus sont trait\u00e9s \u00e9quitablement en mati\u00e8re de risque. Cela permet leur r\u00e9partition en classes de risques homog\u00e8nes, assurant le bon d\u00e9roulement de la segmentation et de la mutualisation. Mais de nos jours, avec le d\u00e9veloppement d\u2019algorithmes complexes, des sources de donn\u00e9es plus riches et l\u2019am\u00e9lioration des m\u00e9thodes d\u2019interpr\u00e9tabilit\u00e9, de multiples sources de biais ont \u00e9t\u00e9 expos\u00e9es et l\u2019objectivit\u00e9 des donn\u00e9es et des mod\u00e8les est remise en question.<\/p>\n<p>Le secteur des assurances fait l\u2019objet d\u2019une attention croissante, le public et les r\u00e9gulateurs exigeant plus de transparence et de justification sur les questions d\u2019\u00e9quit\u00e9. Mais il existe une multitude de points de vue sur ce sujet. Premi\u00e8rement, d\u2019un point de vue juridique, la discrimination est d\u00e9finie par la loi comme la diff\u00e9rence de traitement entre des individus se trouvant dans des situations similaires en raison de crit\u00e8res prohib\u00e9s. Ces crit\u00e8res sont \u00e9galement d\u00e9finis par la loi, mais d\u00e9pendent de la juridiction. Par exemple, aux \u00c9tats-Unis, selon les \u00c9tats, les informations sur l\u2019origine peuvent \u00eatre utilis\u00e9es dans toutes les lignes d\u2019assurance, mais elles sont strictement interdites par la Charte des Droits Fondamentaux de l\u2019Union Europ\u00e9enne.<\/p>\n<p>Lorsque les crit\u00e8res sont utilis\u00e9s explicitement dans la prise de d\u00e9cision, on parle de discrimination \u00ab\u00a0directe\u00a0\u00bb et lorsque la pratique est apparemment neutre mais conduit tout de m\u00eame \u00e0 des traitements diff\u00e9rents, on parle de discrimination \u00ab\u00a0indirecte\u00a0\u00bb. Ensuite, d\u2019un point de vue statistique, il existe de nombreuses d\u00e9finitions diff\u00e9rentes de l\u2019\u00e9quit\u00e9, qui tentent de traduire math\u00e9matiquement diff\u00e9rentes visions du monde mais ne sont pas compatibles entre elles.<\/p>\n<p>Jusqu\u2019\u00e0 pr\u00e9sent, les actuaires ont emp\u00each\u00e9 la discrimination directe en ne recueillant pas d\u2019informations sensibles<span style=\"font-size: 13.3333px;\"> [1]<\/span>\u00a0sur les individus, conform\u00e9ment au RGPD<span style=\"font-size: 13.3333px;\"> [2]<\/span>. Cette m\u00e9thode n\u2019est pas une solution, car il peut encore y avoir une discrimination indirecte. En effet, si les variables non sensibles ont une relation de d\u00e9pendance avec les variables sensibles, ce qui est presque toujours le cas, les mod\u00e8les peuvent d\u00e9duire ces derni\u00e8res et maintenir un traitement injuste. Ces variables non sensibles qui permettent d\u2019inf\u00e9rer les variables sensibles sont appel\u00e9es proxys. De plus, si les informations sensibles ne sont pas collect\u00e9es, il est impossible de v\u00e9rifier s\u2019il y a discrimination.<\/p>\n<p>De nombreux articles de recherche ont tent\u00e9 de fournir une d\u00e9finition math\u00e9matique de l\u2019\u00e9quit\u00e9. Il existe deux visions : l\u2019\u00e9quit\u00e9 de groupe, qui vise \u00e0 traiter diff\u00e9rents groupes de mani\u00e8re \u00e9gale, et l\u2019\u00e9quit\u00e9 individuelle, qui vise \u00e0 traiter de mani\u00e8re similaire des individus similaires. Parmi la premi\u00e8re cat\u00e9gorie, on peut citer la parit\u00e9 statistique, qui recherche l\u2019ind\u00e9pendance entre la pr\u00e9diction et les variables sensibles, l\u2019\u00e9galit\u00e9 des opportunit\u00e9s, qui recherche l\u2019ind\u00e9pendance entre la pr\u00e9diction et les variables sensibles, conditionnellement \u00e0 la vraie classe, qui se traduit par l\u2019\u00e9galit\u00e9 des taux de vrais et de faux positifs, et enfin l\u2019\u00e9galit\u00e9 des chances qui est la m\u00eame chose que l\u2019\u00e9galit\u00e9 des opportunit\u00e9s, mais uniquement pour les taux de vrais positifs. Aux \u00c9tats-Unis, le <em>Disparate Impact<\/em> est une mesure populaire qui est une cons\u00e9quence de la parit\u00e9 statistique et est utilis\u00e9e dans les tribunaux pour prouver une all\u00e9gation de discrimination, mais ne s\u2019applique qu\u2019\u00e0 la classification binaire avec une variable prot\u00e9g\u00e9e, binaire \u00e9galement. Pour l\u2019\u00e9quit\u00e9 individuelle, les crit\u00e8res math\u00e9matiques ne sont pas aussi simples, car cela implique de d\u00e9finir une distance entre les individus pour mesurer leur similarit\u00e9, ce qui n\u2019est pas une question triviale.<\/p>\n<h3>UNE METHODE DE PRETRAITEMENT POUR ATTENUER LA DISCRIMINATION INDIRECTE<\/h3>\n<p>La probl\u00e9matique de ce m\u00e9moire d\u2019actuariat est : comment att\u00e9nuer la discrimination indirecte ? Les solutions consistent g\u00e9n\u00e9ralement soit \u00e0 travailler directement sur les donn\u00e9es (pr\u00e9-traitement), sur le mod\u00e8le (pendant le traitement) ou sur les pr\u00e9dictions (post-traitement).<\/p>\n<p>Nous avons d\u00e9cid\u00e9 de rechercher une m\u00e9thode de pr\u00e9-traitement, bas\u00e9e sur l\u2019une des d\u00e9finitions d\u2019\u00e9quit\u00e9 de groupe, la parit\u00e9 statistique. Cela permet ensuite l\u2019utilisation de tout type de mod\u00e8le car le probl\u00e8me est trait\u00e9 le plus en amont possible dans le processus, directement sur les donn\u00e9es.<\/p>\n<p>Nous nous sommes inspir\u00e9s du processus de Gram-Schmidt, une m\u00e9thode d\u2019orthogonalisation d\u2019un ensemble de vecteurs dans un espace avec un produit interne. La covariance est un produit scalaire dans l\u2019espace des variables al\u00e9atoires centr\u00e9es de variance finie. Pour en revenir \u00e0 la d\u00e9finition de la parit\u00e9 statistique, nous recherchons une pr\u00e9diction ind\u00e9pendante des variables prot\u00e9g\u00e9es. Le but de notre m\u00e9thode est donc de transformer les variables non sensibles de mani\u00e8re \u00e0 ce qu\u2019elles deviennent d\u00e9corr\u00e9l\u00e9es des variables sensibles. Bien entendu, il s\u2019agit d\u2019une approximation, car la corr\u00e9lation n\u2019est que la composante lin\u00e9aire de la d\u00e9pendance.<\/p>\n<p>La non-corr\u00e9lation \u00e9quivaut \u00e0 l\u2019orthogonalit\u00e9 dans l\u2019espace des variables al\u00e9atoires centr\u00e9es \u00e0 variance finie, cela nous a donc permis de poser le probl\u00e8me : avec X<sub>1<\/sub>, . . ., X<sub>s<\/sub> les s variables sensibles et X<sub>s+1<\/sub>, \u2026, X<sub>n<\/sub> les variables non sensibles, nous cherchons la matrice de passage A qui donne X\u2032 = AX, donnant l\u2019expression des nouvelles coordonn\u00e9es en fonction des anciennes. Les s premi\u00e8res variables sont inchang\u00e9es. Cela nous donne une matrice de transition de la forme\u00a0:<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter wp-image-7834\" src=\"https:\/\/variances.eu\/wp-content\/uploads\/2024\/01\/Eq1.png\" alt=\"\" width=\"273\" height=\"120\" srcset=\"https:\/\/variances.eu\/wp-content\/uploads\/2024\/01\/Eq1.png 940w, https:\/\/variances.eu\/wp-content\/uploads\/2024\/01\/Eq1-300x132.png 300w, https:\/\/variances.eu\/wp-content\/uploads\/2024\/01\/Eq1-600x264.png 600w\" sizes=\"(max-width: 273px) 100vw, 273px\" \/><\/p>\n<p>Nous cherchons les variables transform\u00e9es X\u2032<sub>s+1<\/sub>, . . ., X\u2032<sub>n<\/sub> telles que corr(X<sub>i<\/sub>,X\u2032<sub>j<\/sub>) = 0 pour i = 1, \u2026, s et j = s + 1, \u2026, n. Cela nous donne un syst\u00e8me de s \u00e9quations \u00e0 n inconnues, avec un nombre infini de solutions car n &gt; s. Nous devons poser n \u2212 s contraintes additionnelles de mani\u00e8re \u00e0 obtenir un syst\u00e8me complet. Nous avons fait le choix d\u2019exprimer chaque nouveau vecteur en fonction des vecteurs sensibles ainsi que de son homologue dans l\u2019ancienne base :<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter wp-image-7835\" src=\"https:\/\/variances.eu\/wp-content\/uploads\/2024\/01\/Eq2.png\" alt=\"\" width=\"355\" height=\"80\" srcset=\"https:\/\/variances.eu\/wp-content\/uploads\/2024\/01\/Eq2.png 1068w, https:\/\/variances.eu\/wp-content\/uploads\/2024\/01\/Eq2-300x68.png 300w, https:\/\/variances.eu\/wp-content\/uploads\/2024\/01\/Eq2-1024x231.png 1024w, https:\/\/variances.eu\/wp-content\/uploads\/2024\/01\/Eq2-600x135.png 600w\" sizes=\"(max-width: 355px) 100vw, 355px\" \/><\/p>\n<p class=\"CorpsA\" style=\"text-align: justify;\"><span class=\"Aucun\">Cela r\u00e9duit le probl\u00e8me \u00e0 s \u00e9quations et s + 1 inconnues. Une id\u00e9e pour poser la derni\u00e8re contrainte est de chercher \u00e0 minimiser la distance entre les anciens et les nouveaux vecteurs non sensibles : min d(X<sub>k<\/sub>,X\u2032<sub>k<\/sub>). Le probl\u00e8me a une solution car la distance (correspondant \u00e0 la variance de la diff\u00e9rence des deux variables al\u00e9atoires) est positive. Nous avons enfin :<\/span><\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter wp-image-7839\" src=\"https:\/\/variances.eu\/wp-content\/uploads\/2024\/01\/Eq4-2.png\" alt=\"\" width=\"932\" height=\"115\" srcset=\"https:\/\/variances.eu\/wp-content\/uploads\/2024\/01\/Eq4-2.png 2860w, https:\/\/variances.eu\/wp-content\/uploads\/2024\/01\/Eq4-2-300x37.png 300w, https:\/\/variances.eu\/wp-content\/uploads\/2024\/01\/Eq4-2-1024x126.png 1024w, https:\/\/variances.eu\/wp-content\/uploads\/2024\/01\/Eq4-2-600x74.png 600w, https:\/\/variances.eu\/wp-content\/uploads\/2024\/01\/Eq4-2-1536x190.png 1536w, https:\/\/variances.eu\/wp-content\/uploads\/2024\/01\/Eq4-2-2048x253.png 2048w, https:\/\/variances.eu\/wp-content\/uploads\/2024\/01\/Eq4-2-1080x133.png 1080w\" sizes=\"(max-width: 932px) 100vw, 932px\" \/><\/p>\n<p class=\"CorpsA\" style=\"text-align: justify;\"><span class=\"Aucun\">En r\u00e9solvant le probl\u00e8me pour tous les k = s+1, \u2026, n nous obtenons A et trouvons X\u2032 = AX.<\/span><\/p>\n<h3>ILLUSTRATION SUR DES DONNEES SIMULEES SIMPLES<\/h3>\n<p>Pour illustrer la m\u00e9thode, nous avons d\u2019abord utilis\u00e9 des donn\u00e9es simul\u00e9es. La raison est que nous voulons conna\u00eetre les v\u00e9ritables relations entre les variables, ce qui n\u2019est pas le cas avec des donn\u00e9es r\u00e9elles. Le processus de simulation repose sur la th\u00e9orie des copules. Nous avons cr\u00e9\u00e9 un jeu de donn\u00e9es avec deux variables sensibles binaires, A et B, quatre variables normales non sensibles, X<sup>(1)<\/sup>, \u2026, X<sup>(4)<\/sup> et une variable d\u2019int\u00e9r\u00eat binaire. Toutes ces variables sont corr\u00e9l\u00e9es entre elles de mani\u00e8re contr\u00f4l\u00e9e. Nous appliquons ensuite un mod\u00e8le de r\u00e9gression logistique, choisi pour sa simplicit\u00e9 et son interpr\u00e9tabilit\u00e9, utilisant d\u2019abord toutes les variables, puis uniquement les variables non sensibles et enfin les variables non sensibles transform\u00e9es.<\/p>\n<p>Le mod\u00e8le utilisant toutes les variables est, sans surprise, injuste au regard des trois d\u00e9finitions de l\u2019\u00e9quit\u00e9 introduites pr\u00e9c\u00e9demment, parit\u00e9 statistique, \u00e9galit\u00e9 des chances et \u00e9galit\u00e9 des opportunit\u00e9s. Selon les trois d\u00e9finitions, les groupes A = 1 et B = 1 sont d\u00e9savantag\u00e9s par le mod\u00e8le par rapport aux groupes A = 0 et B = 0. Ce mod\u00e8le fait preuve de discrimination directe car il y a une diff\u00e9rence de traitement entre groupes suite \u00e0 une utilisation explicite des variables sensibles.<\/p>\n<p>Lorsque nous nous contentons de supprimer les variables prot\u00e9g\u00e9es, il y a une l\u00e9g\u00e8re baisse de la performance pr\u00e9dictive, mesur\u00e9e par la pr\u00e9cision et l\u2019AUC (<em>Area Under the ROC Curve<\/em>). En ce qui concerne l\u2019\u00e9quit\u00e9, la situation est pire lorsque l\u2019on regarde la variable A, avec le groupe A = 1 encore plus d\u00e9savantag\u00e9 par le mod\u00e8le qu\u2019avant, et meilleure lorsque l\u2019on regarde la variable B, avec le groupe B = 1 toujours le plus d\u00e9favoris\u00e9 mais moins qu\u2019avec le mod\u00e8le utilisant toutes les variables. En n\u2019utilisant pas les variables sensibles, nous avons donc \u00e9vit\u00e9 la discrimination directe, mais pas la discrimination indirecte car il existe toujours une diff\u00e9rence de traitement entre les groupes.<\/p>\n<p>Se contenter de supprimer les variables prot\u00e9g\u00e9es n\u2019est donc pas une solution pour \u00e9viter la discrimination, et selon les relations entre les variables, cela peut soit d\u00e9t\u00e9riorer, comme nous l\u2019avons vu avec la variable A, ou am\u00e9liorer l\u2019\u00e9quit\u00e9, comme nous l\u2019avons vu avec la variable B.<\/p>\n<p>Enfin, nous appliquons notre m\u00e9thode de pr\u00e9-traitement et transformons les variables non sensibles. Les matrices de corr\u00e9lation avant et apr\u00e8s transformation en figure 1 montrent le succ\u00e8s de notre m\u00e9thode : il n\u2019y a plus de corr\u00e9lation entre les variables sensibles et les variables transform\u00e9es.<\/p>\n<div id=\"attachment_7843\" style=\"width: 910px\" class=\"wp-caption aligncenter\"><img loading=\"lazy\" decoding=\"async\" aria-describedby=\"caption-attachment-7843\" class=\"size-full wp-image-7843\" src=\"https:\/\/variances.eu\/wp-content\/uploads\/2024\/01\/i1-1.png\" alt=\"\" width=\"900\" height=\"311\" srcset=\"https:\/\/variances.eu\/wp-content\/uploads\/2024\/01\/i1-1.png 900w, https:\/\/variances.eu\/wp-content\/uploads\/2024\/01\/i1-1-300x104.png 300w, https:\/\/variances.eu\/wp-content\/uploads\/2024\/01\/i1-1-600x207.png 600w\" sizes=\"(max-width: 900px) 100vw, 900px\" \/><p id=\"caption-attachment-7843\" class=\"wp-caption-text\">Figure 1 : Heatmaps des corr\u00e9lations avant et apr\u00e8s transformation des X(i)<\/p><\/div>\n<p>Nous appliquons ensuite le mod\u00e8le aux variables non sensibles transform\u00e9es. Par rapport au mod\u00e8le utilisant uniquement des variables non sensibles, il y a une baisse de la performance pr\u00e9dictive avec une pr\u00e9cision et une AUC inf\u00e9rieures. Le mod\u00e8le traite d\u00e9sormais presque parfaitement \u00e9quitablement les groupes selon la d\u00e9finition de la parit\u00e9 statistique, ce qui \u00e9tait l\u2019objectif de la m\u00e9thode. Mais quand on regarde les deux autres d\u00e9finitions d\u2019\u00e9quit\u00e9, pour la variable A, le mod\u00e8le traite les deux groupes de mani\u00e8re plus juste qu\u2019auparavant, mais maintenant c\u2019est le groupe A = 0 qui est le plus d\u00e9favoris\u00e9. Pour la variable B, le mod\u00e8le est moins juste qu\u2019avant et encore une fois, c\u2019est maintenant le groupe B = 0 qui est le plus d\u00e9favoris\u00e9 selon ces deux d\u00e9finitions.<\/p>\n<p>Notre m\u00e9thode a approch\u00e9 l\u2019ind\u00e9pendance avec la non-corr\u00e9lation, et nous avons r\u00e9ussi \u00e0 approcher la parit\u00e9 statistique. Mais il y a quelques inconv\u00e9nients : une baisse des performances, des probl\u00e8mes d\u2019interpr\u00e9tabilit\u00e9 concernant les variables transform\u00e9es et une incompatibilit\u00e9 avec d\u2019autres d\u00e9finitions d\u2019\u00e9quit\u00e9.<\/p>\n<h3>ILLUSTRATION SUR DES DONNEES REELLES DE MORTALITE<\/h3>\n<p>Nous avons appliqu\u00e9 la m\u00eame m\u00e9thode \u00e0 un cas d\u2019utilisation r\u00e9el : la mortalit\u00e9 des personnes diagnostiqu\u00e9es avec un m\u00e9lanome non m\u00e9tastatique, une forme de cancer de la peau. Pour r\u00e9aliser cette \u00e9tude, nous avons utilis\u00e9 les donn\u00e9es de la base de recherche publique SEER du <em>National Cancer Institute<\/em> aux \u00c9tats-Unis. C\u2019est une source d\u2019information tr\u00e8s riche et compl\u00e8te, mais qui a n\u00e9cessit\u00e9 un long traitement avant de pouvoir \u00eatre utilis\u00e9e. L\u2019analyse de survie est tr\u00e8s sp\u00e9cifique car l\u2019objectif est de mod\u00e9liser la dur\u00e9e de survie, qui n\u2019est souvent observ\u00e9e que partiellement en raison des ph\u00e9nom\u00e8nes de censure et de troncature. Pour r\u00e9soudre ce probl\u00e8me, nous devons prendre en compte l\u2019exposition de chaque individu et l\u2019utiliser comme poids dans le mod\u00e8le de r\u00e9gression logistique standard.<\/p>\n<p>Une premi\u00e8re \u00e9tape de la mod\u00e9lisation a \u00e9t\u00e9 la s\u00e9lection de variables avec trois types de contraintes : m\u00e9dicale, statistique et de souscription. En effet, les variables qui ne sont pas pertinentes m\u00e9dicalement, statistiquement ou qui ne peuvent \u00eatre obtenues au moment de la souscription ne doivent pas \u00eatre utilis\u00e9es dans le mod\u00e8le. Apr\u00e8s cette s\u00e9lection, il nous reste trois variables sensibles, que sont le sexe (cat\u00e9gories homme, femme), l\u2019origine(cat\u00e9gories <em>White<\/em>, <em>Hispanic<\/em>, <em>Black<\/em>\u2026) et l\u2019\u00e9tat civil (cat\u00e9gories c\u00e9libataire, mari\u00e9, veuf\u2026), ainsi que douze variables non sensibles.<\/p>\n<p>Comme pour les donn\u00e9es simul\u00e9es, nous commen\u00e7ons par appliquer notre mod\u00e8le de r\u00e9gression logistique \u00e0 toutes les variables. Le mod\u00e8le fonctionne tr\u00e8s bien, avec une AUC de 0,8769. Nous examinons ensuite les mesures d\u2019\u00e9quit\u00e9 et, sans grande surprise, nous constatons que le mod\u00e8le n\u2019est \u00e9quitable selon aucune des trois d\u00e9finitions d\u2019\u00e9quit\u00e9. En regardant les taux d\u2019acceptation par origine dans la figure 3a, nous constatons qu\u2019il existe de grands \u00e9carts entre les taux d\u2019acceptation, un groupe \u00e9tant plus d\u00e9favoris\u00e9 par le mod\u00e8le que les autres. Lorsque nous supprimons les variables prot\u00e9g\u00e9es, il y a, comme dans le cas simul\u00e9, une l\u00e9g\u00e8re baisse des performances, et comme le montre la figure 3b, les niveaux ont chang\u00e9 mais il existe toujours des \u00e9carts entre les groupes et le m\u00eame reste le plus d\u00e9favoris\u00e9. Nous appliquons ensuite notre m\u00e9thode de d\u00e9corr\u00e9lation, et obtenons des vecteurs transform\u00e9s non corr\u00e9l\u00e9s aux vecteurs sensibles. La figure 2 donne la matrice de corr\u00e9lation avant et apr\u00e8s transformation.<\/p>\n<p>&nbsp;<\/p>\n<div id=\"attachment_7844\" style=\"width: 910px\" class=\"wp-caption aligncenter\"><img loading=\"lazy\" decoding=\"async\" aria-describedby=\"caption-attachment-7844\" class=\"size-full wp-image-7844\" src=\"https:\/\/variances.eu\/wp-content\/uploads\/2024\/01\/i2.png\" alt=\"\" width=\"900\" height=\"386\" srcset=\"https:\/\/variances.eu\/wp-content\/uploads\/2024\/01\/i2.png 900w, https:\/\/variances.eu\/wp-content\/uploads\/2024\/01\/i2-300x129.png 300w, https:\/\/variances.eu\/wp-content\/uploads\/2024\/01\/i2-600x257.png 600w\" sizes=\"(max-width: 900px) 100vw, 900px\" \/><p id=\"caption-attachment-7844\" class=\"wp-caption-text\">Figure 2\u00a0: Corr\u00e9lations, avant (a) et apr\u00e8s (b) transformation, entre les attributs sensibles encadr\u00e9s en noir et les autres attributs<\/p><\/div>\n<p>Lors de l\u2019application du mod\u00e8le \u00e0 ces variables transform\u00e9es, nous avons encore une diminution des performances pr\u00e9dictives avec une AUC plus faible, \u00e0 0,8534. En regardant les taux d\u2019acceptation par origine, les \u00e9carts sont d\u00e9sormais tr\u00e8s faibles entre les groupes. Pour toutes les variables prot\u00e9g\u00e9es, nous avons la m\u00eame conclusion : nous avons presque atteint la parit\u00e9 statistique et l\u2019\u00e9galit\u00e9 des chances mais nous sommes moins proches de l\u2019\u00e9galit\u00e9 des opportunit\u00e9s, et le groupe le plus d\u00e9favoris\u00e9 a chang\u00e9.<\/p>\n<div id=\"attachment_7845\" style=\"width: 926px\" class=\"wp-caption aligncenter\"><img loading=\"lazy\" decoding=\"async\" aria-describedby=\"caption-attachment-7845\" class=\"wp-image-7845 size-full\" src=\"https:\/\/variances.eu\/wp-content\/uploads\/2024\/01\/i3.png\" alt=\"\" width=\"916\" height=\"269\" srcset=\"https:\/\/variances.eu\/wp-content\/uploads\/2024\/01\/i3.png 916w, https:\/\/variances.eu\/wp-content\/uploads\/2024\/01\/i3-300x88.png 300w, https:\/\/variances.eu\/wp-content\/uploads\/2024\/01\/i3-600x176.png 600w\" sizes=\"(max-width: 916px) 100vw, 916px\" \/><p id=\"caption-attachment-7845\" class=\"wp-caption-text\">Figure 3 : Taux d\u2019acceptation par origine, avec toutes les variables (a), sans les variables prot\u00e9g\u00e9es (b) et avec les variables transform\u00e9es (c), de gauche \u00e0 droite<\/p><\/div>\n<h3>EN CONCLUSION<\/h3>\n<p>Nous avons les m\u00eames conclusions que dans le cas simul\u00e9 : il ne suffit pas de supprimer les variables prot\u00e9g\u00e9es pour avoir un mod\u00e8le juste. Notre m\u00e9thode nous a permis d\u2019approcher la parit\u00e9 statistique, il y a un compromis entre performance et \u00e9quit\u00e9, et toutes les d\u00e9finitions d\u2019\u00e9quit\u00e9 ne sont pas compatibles.<\/p>\n<p>&nbsp;<\/p>\n<p>Lien vers le m\u00e9moire complet :\u00a0<span style=\"text-decoration: underline;\"><span style=\"color: #0000ff;\"><a style=\"color: #0000ff; text-decoration: underline;\" href=\"https:\/\/www.institutdesactuaires.com\/se-documenter\/memoires\/memoires-d-actuariat-4651?id=22f397bf2d93510631119af5942bd8da\">https:\/\/www.institutdesactuaires.com\/se-documenter\/memoires\/memoires-d-actuariat-4651?id=22f397bf2d93510631119af5942bd8da<\/a><\/span><\/span><\/p>\n<p><em>Mots-cl\u00e9s : \u00e9quit\u00e9 &#8211; discrimination indirecte &#8211; parit\u00e9 statistique &#8211; d\u00e9corr\u00e9lation &#8211; Machine Learning &#8211; Assurance &#8211; Actuariat<\/em><\/p>\n<hr \/>\n<p><em><sup>[1] <\/sup>Les variables sensibles, aussi appel\u00e9es prot\u00e9g\u00e9es, d\u00e9pendent des r\u00e9gulateurs, mais aussi de la soci\u00e9t\u00e9 dans son ensemble, car il s\u2019agit d\u2019une pr\u00e9occupation \u00e0 la fois juridique et \u00e9thique. Les variables sensibles sont par exemple le sexe, la nationalit\u00e9, l\u2019\u00e9tat civil\u2026<\/em><\/p>\n<p><em>[2] Le sigle RGPD signifie \u00ab R\u00e8glement G\u00e9n\u00e9ral sur la Protection des Donn\u00e9es \u00bb. Le RGPD encadre le traitement des donn\u00e9es personnelles sur le territoire de l\u2019Union europ\u00e9enne.<\/em><\/p>\n","protected":false},"excerpt":{"rendered":"<p>CONCEPTS ET REGLEMENTATION AUTOUR DE LA DISCRIMINATION L\u2019\u00e9quit\u00e9 actuarielle est un concept cl\u00e9 pour les assureurs, qui signifie que les individus sont trait\u00e9s \u00e9quitablement en mati\u00e8re de risque. Cela permet leur r\u00e9partition en classes de risques homog\u00e8nes, assurant le bon d\u00e9roulement de la segmentation et de la mutualisation. Mais de nos jours, avec le d\u00e9veloppement [&hellip;]<\/p>\n","protected":false},"author":476,"featured_media":7849,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_et_pb_use_builder":"","_et_pb_old_content":"","_et_gb_content_width":"","_exactmetrics_skip_tracking":false,"footnotes":""},"categories":[141],"tags":[],"class_list":["post-7832","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-assurance","et-has-post-format-content","et_post_format-et-post-format-standard"],"_links":{"self":[{"href":"https:\/\/variances.eu\/index.php?rest_route=\/wp\/v2\/posts\/7832","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/variances.eu\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/variances.eu\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/variances.eu\/index.php?rest_route=\/wp\/v2\/users\/476"}],"replies":[{"embeddable":true,"href":"https:\/\/variances.eu\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=7832"}],"version-history":[{"count":0,"href":"https:\/\/variances.eu\/index.php?rest_route=\/wp\/v2\/posts\/7832\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/variances.eu\/index.php?rest_route=\/wp\/v2\/media\/7849"}],"wp:attachment":[{"href":"https:\/\/variances.eu\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=7832"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/variances.eu\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=7832"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/variances.eu\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=7832"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}