{"id":3997,"date":"2019-03-29T07:50:28","date_gmt":"2019-03-29T05:50:28","guid":{"rendered":"http:\/\/variances.eu\/?p=3997"},"modified":"2020-04-29T10:32:53","modified_gmt":"2020-04-29T08:32:53","slug":"famille-data-scientists-sagrandit-bienvenue-data-scientist-economiste","status":"publish","type":"post","link":"https:\/\/variances.eu\/?p=3997","title":{"rendered":"La famille des Data Scientists s\u2019agrandit : bienvenue au data scientist \u00e9conomiste !*"},"content":{"rendered":"<p>Au sein de la grande et r\u00e9cente famille des data scientists, divers profils ont \u00e9merg\u00e9 au-del\u00e0 des traditionnels statisticiens\u00a0: data analystes, data engineers, Kaggle masters, machine learners,\u2026 et depuis quelque temps les data scientists \u00e9conomistes que l\u2019on pourrait \u00e9galement appeler data strategists.<\/p>\n<p>Ces derniers poss\u00e8dent des comp\u00e9tences bien sp\u00e9cifiques combinant ma\u00eetrise des outils quantitatifs et compr\u00e9hension structurelle des ph\u00e9nom\u00e8nes \u00e9conomiques sous-jacents, le tout au service d\u2019une vision transverse leur permettant de faire le lien entre la strat\u00e9gie de l\u2019entreprise, les \u00e9volutions des march\u00e9s et les r\u00e9alit\u00e9s op\u00e9rationnelles. Les GAFA, et plus g\u00e9n\u00e9ralement les entreprises de la tech, en ont pris conscience tr\u00e8s rapidement et en recrutent chaque ann\u00e9e davantage, qu\u2019il s\u2019agisse d\u2019analystes fraichement dipl\u00f4m\u00e9s ou de profils beaucoup plus s\u00e9niors de Chief Economists parmi lesquels on peut citer Susan Athey, Pat Bajari, Steve Tadelis ou encore Hal Varian.<\/p>\n<p>Nous nous proposons dans cet article de r\u00e9pondre aux questions suivantes\u00a0:<\/p>\n<ul>\n<li>Qu\u2019est-ce qui fait la sp\u00e9cificit\u00e9 de ces data scientists \u00e9conomistes\u00a0?<\/li>\n<li>Quelles entreprises peuvent b\u00e9n\u00e9ficier de leurs comp\u00e9tences\u00a0?<\/li>\n<li>Pourquoi un ENSAE est-il particuli\u00e8rement bien plac\u00e9 pour devenir un parfait data scientist \u00e9conomiste et quels types de postes peut-il esp\u00e9rer occuper\u00a0?<\/li>\n<\/ul>\n<h4><strong>Les donn\u00e9es sont un actif strat\u00e9gique qui, combin\u00e9 aux algorithmes de Machine Learning et d\u2019Intelligence Artificielle, g\u00e9n\u00e8rent des transformations majeures au sein des entreprises et des march\u00e9s<\/strong><\/h4>\n<p>Face \u00e0 la profusion de donn\u00e9es et de moyens disponibles pour les traiter, les entreprises sont aujourd\u2019hui dans la n\u00e9cessit\u00e9 de d\u00e9finir une strat\u00e9gie data. Elles doivent repenser la mani\u00e8re d\u2019aborder leur c\u0153ur de m\u00e9tier historique et, d\u2019un point de vue op\u00e9rationnel, elles doivent \u00e9galement faire \u00e9voluer leurs mani\u00e8res de travailler.<\/p>\n<p>Au-del\u00e0 de leurs propres situations, leurs march\u00e9s sont confront\u00e9s \u00e0 d\u2019importants changements. D\u2019une part les entreprises qui poss\u00e8dent des donn\u00e9es et qui savent les traiter sont susceptibles de pivoter vers de nouveaux secteurs, redessinant ainsi les fronti\u00e8res des march\u00e9s historiques. D\u2019autre part, on assiste \u00e0 la g\u00e9n\u00e9ralisation du mod\u00e8le des plateformes bifaces qui interm\u00e9dient les acteurs historiques. Une des particularit\u00e9s de ce mod\u00e8le est d\u2019am\u00e9liorer l\u2019efficience des march\u00e9s gr\u00e2ce aux donn\u00e9es collect\u00e9es.<\/p>\n<p>Cette double r\u00e9volution \u2013 data et algorithmes d\u2019un c\u00f4t\u00e9, mutation des march\u00e9s de l\u2019autre \u2013 fait \u00e9cho aux buzz de ces derni\u00e8res ann\u00e9es autour du Big Data, de l\u2019Intelligence Artificielle (IA), et de l\u2019uberisation. Mais au-del\u00e0 des buzz, c\u2019est la valeur strat\u00e9gique des donn\u00e9es qui est au c\u0153ur de cette r\u00e9volution. Et c\u2019est tout naturellement que le Data Scientist, acteur central de cette r\u00e9volution, sera d\u2019autant plus \u00e0 m\u00eame de tirer son \u00e9pingle du jeu qu\u2019il disposera de comp\u00e9tences en \u00e9conomie lui permettant de participer \u00e0 la cr\u00e9ation de valeur strat\u00e9gique sans se limiter \u00e0 la composante technique de son m\u00e9tier. Il endossera alors le r\u00f4le de Data Strategist\u00a0!<\/p>\n<h4><strong>Les profils de data scientists \u00e9conomistes sont cr\u00e9ateurs de valeur dans un contexte de transformation des m\u00e9tiers historiques<\/strong><\/h4>\n<p>Tout d\u2019abord, les \u00e9conomistes occupent une place \u00e0 part au sein de la famille des data scientists. Bien qu\u2019ils fassent partie des profils historiques de data scientists, ils ne correspondent bien souvent pas aux canons du domaine pour lesquels les dimensions \u00ab\u00a0code\u00a0\u00bb et technologies Big Data font r\u00e9f\u00e9rence.<\/p>\n<h4><strong>Comment expliquer ce d\u00e9calage de perception qui fait que les profils d\u2019\u00e9conomistes ne sont pas compl\u00e8tement per\u00e7us comme des data scientists\u00a0?<\/strong><\/h4>\n<p>En premier lieu, l\u2019\u00e9conomie empirique et l\u2019\u00e9conom\u00e9trie ont longtemps concern\u00e9 plut\u00f4t la macro\u00e9conomie. Cet aspect historique est en grande partie d\u00fb aux donn\u00e9es disponibles, longtemps constitu\u00e9es de s\u00e9ries temporelles macro\u00e9conomiques. Ce n\u2019est que depuis la fin des ann\u00e9es 90 que la micro\u00e9conom\u00e9trie a vraiment pris de l\u2019ampleur, notamment gr\u00e2ce \u00e0 l\u2019explosion de la masse de donn\u00e9es individuelles disponibles, tant sur les personnes que sur les entreprises.<\/p>\n<p>Ensuite, il faut reconna\u00eetre que malgr\u00e9 l\u2019usage intensif de donn\u00e9es micro, les \u00e9conomistes ont mis du temps \u00e0 s&rsquo;approprier les techniques les plus r\u00e9centes issues du Machine Learning. Ce constat est en partie li\u00e9 au fait que ces outils ne fournissaient pas directement les r\u00e9ponses auxquelles les \u00e9conomistes sont habitu\u00e9s (exemple\u00a0: pr\u00e9cision des estimations, causalit\u00e9, etc.). Cependant, les d\u00e9veloppements r\u00e9cents de l\u2019\u00e9conom\u00e9trie sont en train de changer la donne en cr\u00e9ant des ponts avec le Machine Learning et l\u2019intelligence artificielle.<\/p>\n<h4><strong>Et pourtant, leur approche particuli\u00e8re des donn\u00e9es leur conf\u00e8re un avantage comparatif ind\u00e9niable<\/strong><\/h4>\n<p>Dans un article r\u00e9cent de la Harvard Business Review (HBR) (<em><span style=\"text-decoration: underline;\"><span style=\"color: #0000ff;\"><a style=\"color: #0000ff; text-decoration: underline;\" href=\"https:\/\/hbr.org\/2019\/01\/data-science-and-the-art-of-persuasion\">https:\/\/hbr.org\/2019\/01\/data-science-and-the-art-of-persuasion<\/a><\/span><\/span><\/em>), les auteurs s\u2019int\u00e9ressent \u00e0 la bonne mani\u00e8re de constituer une \u00e9quipe de data science. Le constat de d\u00e9part est simple\u00a0: les dirigeants se plaignent de ne pas assez voir le r\u00e9sultat de leurs investissements dans les projets data. Un des points avanc\u00e9s pour expliquer cette d\u00e9ception concerne l\u2019importance de poser les bonnes questions et de donner du sens aux donn\u00e9es. Or justement cette capacit\u00e9 repose davantage sur des comp\u00e9tences li\u00e9es aux sciences sociales que sur des comp\u00e9tences en math\u00e9matiques ou en informatique.<\/p>\n<p>Ces comp\u00e9tences, alli\u00e9es \u00e0 la puissance des derniers algorithmes et des derni\u00e8res technologies disponibles, permettent aux data scientists \u00e9conomistes d\u2019avoir une valeur ajout\u00e9e ind\u00e9niable en mati\u00e8re d\u2019analyse des donn\u00e9es.<\/p>\n<p>Toute personne qui a d\u00e9j\u00e0 assist\u00e9 \u00e0 un s\u00e9minaire de recherche en \u00e9conomie empirique pourra t\u00e9moigner du fait que le \u00ab\u00a0jeu\u00a0\u00bb dans l\u2019assistance consiste \u00e0 essayer de s\u2019assurer que la strat\u00e9gie d\u2019identification pr\u00e9sent\u00e9e est bien la bonne. L\u2019auditoire essaye pour cela de proposer des contre-exemples sous formes de m\u00e9canismes \u00e9conomiques autres que ceux mis en avant, mais qui aboutiraient aux m\u00eames r\u00e9sultats que ceux observ\u00e9s.<\/p>\n<p>Cet exercice de pens\u00e9e, syst\u00e9matique en \u00e9conomie, permet d\u2019apprendre \u00e0 se poser les bonnes questions\u00a0:<\/p>\n<ul>\n<li>Traquer les biais (s\u00e9lection, endog\u00e9n\u00e9it\u00e9, processus de collecte, etc.)<\/li>\n<li>S\u2019int\u00e9resser aux m\u00e9canismes structurels et pas seulement au r\u00e9sultat global (en forme r\u00e9duite)<\/li>\n<li>D\u00e9passer les corr\u00e9lations pour chercher la causalit\u00e9<\/li>\n<\/ul>\n<h4><strong>L\u2019exemple des indicateurs de suivi pour illustrer cette approche particuli\u00e8re des donn\u00e9es<\/strong><\/h4>\n<p>Les indicateurs de suivi sont indispensables au pilotage des entreprises. Dans notre exp\u00e9rience de consultants, nous sommes cependant surpris de constater que les d\u00e9cisions strat\u00e9giques et op\u00e9rationnelles sont parfois prises sur la foi d\u2019indicateurs qui, au mieux, apportent une vision partielle de l\u2019activit\u00e9, et au pire en apportent une vision biais\u00e9e.<\/p>\n<p>Par exemple, dans un contexte hospitalier, il est important de rechercher des indicateurs de performance corrig\u00e9s des effets de contexte local. L\u2019activit\u00e9 d\u2019un h\u00f4pital d\u00e9pend en effet du niveau de pr\u00e9carit\u00e9 de sa patient\u00e8le\u00a0: recours aux urgences plus important, dur\u00e9es de s\u00e9jour plus longues, moindre taux de recouvrement des factures. Autant d\u2019indicateurs qui, s\u2019ils ne sont pas corrig\u00e9s de l\u2019effet de la pr\u00e9carit\u00e9, peuvent donner une vision biais\u00e9e de la gestion de l\u2019h\u00f4pital (<em>H\u00f4pital 2.0 : Pour une gestion hospitali\u00e8re data-driven<\/em>, Gestions hospitali\u00e8res n\u00b0567, juillet 2017). Cette approche peut \u00e9galement s\u2019appliquer \u00e0 toutes les activit\u00e9s qui incluent une dimension g\u00e9ographique (performance d\u2019\u00e9tablissements scolaires, d\u2019agences bancaires, collecte de d\u00e9chets, etc.).<\/p>\n<p>Au-del\u00e0 de ce probl\u00e8me de mesure partielle ou biais\u00e9e de la r\u00e9alit\u00e9, les indicateurs peuvent m\u00eame, dans certaines situations, avoir un impact n\u00e9gatif sur ce qu\u2019ils mesurent. C\u2019est le cas en particulier quand ils g\u00e9n\u00e8rent des incitations contreproductives. Par exemple, si un indicateur de d\u00e9tection de fraude tient compte uniquement du nombre de cas suspect\u00e9s et ne p\u00e9nalise pas les faux positifs, les agents vont avoir tendance \u00e0 signaler des fraudes potentielles d\u00e8s qu\u2019ils auront le moindre le doute. Un tel indicateur fera probablement diminuer la fraude globale, mais il risque \u00e9galement de faire fortement augmenter le co\u00fbt de d\u00e9tection.<\/p>\n<h4><strong>Les questions auxquelles tentent de r\u00e9pondre les \u00e9conomistes ne sont pas les m\u00eames que celles auxquels tentent de r\u00e9pondre les autres data scientists<\/strong><\/h4>\n<p>Il ne faut pas opposer \u00e9conom\u00e9trie et Machine Learning\u00a0: les approches propos\u00e9es par ces deux disciplines ont \u00e9t\u00e9 d\u00e9velopp\u00e9es pour r\u00e9pondre \u00e0 des questions diff\u00e9rentes mais compl\u00e9mentaires. On assiste d\u2019ailleurs aujourd\u2019hui \u00e0 une forme de convergence entre ces disciplines\u00a0: l\u2019\u00e9conom\u00e9trie s\u2019approprie une partie des m\u00e9thodes usuelles du Machine Learning et inversement, les questions de causalit\u00e9, ch\u00e8res aux \u00e9conom\u00e8tres, font partie des th\u00e8mes identifi\u00e9s pour faire avancer la recherche en Machine Learning.<\/p>\n<p>Les r\u00e9seaux de neurones convolutionnels (Deep Learning) permettent aujourd\u2019hui d\u2019obtenir des r\u00e9sultats impressionnants en mati\u00e8re de reconnaissance d\u2019image ou de traitement du langage naturel. Les for\u00eats al\u00e9atoires et le Boosting font partie des m\u00e9thodes en pointe pour la d\u00e9tection de fraude. D\u2019un point de vue g\u00e9n\u00e9ral, les algorithmes de Machine Learning fonctionnent tr\u00e8s bien pour r\u00e9soudre des probl\u00e8mes pr\u00e9dictifs pour lesquels il n\u2019y a pas d\u2019endog\u00e9n\u00e9it\u00e9, c\u2019est-\u00e0-dire dont les r\u00e9sultats ne sont pas directement en interaction avec le syst\u00e8me \u00e9tudi\u00e9.<\/p>\n<p>En revanche, si l\u2019on cherche \u00e0 estimer une fonction de demande de mani\u00e8re na\u00efve avec des techniques pr\u00e9dictives de Machine Learning, on risque de pr\u00e9dire ce qu\u2019on observe dans les donn\u00e9es, c\u2019est-\u00e0-dire des \u00e9quilibres de march\u00e9, et pas vraiment une fonction de demande.<\/p>\n<p>De purs mod\u00e8les de Machine Learning ou d\u2019intelligence artificielle peuvent \u00eatre erron\u00e9s si les structures de march\u00e9 changent par rapport \u00e0 celles qui pr\u00e9valaient et sur lesquelles ils auraient \u00e9t\u00e9 entra\u00een\u00e9s.<\/p>\n<p>Le data scientist \u00e9conomiste aura donc un avantage pour tout ce qui concerne l\u2019analyse contrefactuelle et la recherche de causalit\u00e9, mais \u00e9galement pour tout ce qui concerne l\u2019\u00e9conom\u00e9trie structurelle. Dans ce domaine, il faut anticiper des situations qui n\u2019ont pas \u00e9t\u00e9 observ\u00e9es par le pass\u00e9. Pour cela, il est n\u00e9cessaire de construire des mod\u00e8les structurels dont les param\u00e8tres sont ensuite estim\u00e9s en utilisant les donn\u00e9es disponibles et \u00e9ventuellement des algorithmes de Machine Learning.<\/p>\n<p>Ces situations surviennent, par exemple, dans des cas de concentration qui modifient les \u00e9quilibres concurrentiels sur un march\u00e9. On les retrouve aussi lors de la mise sur le march\u00e9 d\u2019un nouveau produit partiellement ou totalement substituable aux produits pr\u00e9c\u00e9dents (par exemple un m\u00e9dicament g\u00e9n\u00e9rique \u00e0 l\u2019expiration du brevet du princeps).<\/p>\n<h4><strong>Les data scientists \u00e9conomistes sont \u00e9galement particuli\u00e8rement bien plac\u00e9s pour anticiper les limites de l\u2019utilisation des algorithmes d\u2019intelligence artificielle<\/strong><\/h4>\n<p>Les progr\u00e8s r\u00e9cents de l\u2019intelligence artificielle g\u00e9n\u00e8rent un certain nombre de craintes sur les cons\u00e9quences que pourrait avoir son utilisation trop rapide et non ma\u00eetris\u00e9e. De mani\u00e8re int\u00e9ressante, une partie des sujets \u00e9voqu\u00e9s est en lien direct avec la recherche \u00e9conomique actuelle ou pass\u00e9e.<\/p>\n<p>Prenons deux exemples\u00a0: les risques de discrimination et les questions d\u2019entente tacite.<\/p>\n<p>Dans le premier, on peut craindre que l\u2019intelligence artificielle ne m\u00e8ne \u00e0 des situations de discrimination statistique, c\u2019est-\u00e0-dire \u00e0 des situations o\u00f9 l\u2019algorithme prendrait une d\u00e9cision rationnelle en information imparfaite qui consisterait \u00e0 utiliser l\u2019appartenance \u00e0 un groupe (ethnique par exemple) pour inf\u00e9rer les valeurs des caract\u00e9ristiques qu\u2019il n\u2019observe pas. Bien que ce risque ait d\u00e9j\u00e0 \u00e9t\u00e9 clairement identifi\u00e9 par de nombreux observateurs, les cons\u00e9quences de la discrimination statistique dans le cas de l\u2019intelligence artificielle ont en revanche \u00e9t\u00e9 moins discut\u00e9es. Ce th\u00e8me a pourtant fait l\u2019objet de nombreuses recherches en \u00e9conomie\u00a0: la discrimination statistique est en effet d\u2019autant plus probl\u00e9matique qu\u2019elle peut mener \u00e0 des pr\u00e9dictions auto-r\u00e9alisatrices. C\u2019est par exemple le cas si les agents adoptent des comportements sous-optimaux en anticipant que leurs efforts ne seront pas r\u00e9compens\u00e9s \u00e0 leur juste valeur en raison de la pr\u00e9sence future de discrimination statistique. Cette situation bien connue a par exemple \u00e9t\u00e9 th\u00e9oris\u00e9e par Coate et Loury<a href=\"#_ftn1\" name=\"_ftnref1\">[1]<\/a>.<\/p>\n<p>Dans le second exemple, la question qui se pose est celle d\u2019une situation o\u00f9 deux intelligences artificielles seraient amen\u00e9es \u00e0 fixer des prix dans un duopole. Il est alors tout \u00e0 fait possible qu\u2019elles convergent naturellement vers un \u00e9quilibre d\u2019entente tacite quand bien m\u00eame cette possibilit\u00e9 n\u2019aurait pas \u00e9t\u00e9 explicitement pr\u00e9vue dans le programme. C\u2019est ce qu\u2019ont montr\u00e9 fin 2018 de mani\u00e8re empirique des chercheurs de l\u2019universit\u00e9 de Bologne<a href=\"#_ftn2\" name=\"_ftnref2\">[2]<\/a>.<\/p>\n<h4><strong>Les \u00e9conomistes apportent une compr\u00e9hension strat\u00e9gique de l\u2019\u00e9volution des march\u00e9s et de la valeur des donn\u00e9es<\/strong><\/h4>\n<p>Les GAFA et plus globalement les entreprises de la <em>tech<\/em> ont compris l\u2019importance des \u00e9conomistes et en recrutent non seulement sur des postes strat\u00e9giques (Chief Economist) mais aussi sur des postes interm\u00e9diaires (Product Owner) ou encore \u00e0 des postes plus op\u00e9rationnels (Analystes ou Data Scientists). Amazon, sous l\u2019impulsion de Pat Bajari, son Chief Economist, est ainsi devenu un des premiers employeurs de docteurs en \u00e9conomie qui sont int\u00e9gr\u00e9s au sein de diverses \u00e9quipes.<\/p>\n<p>Une des raisons pour expliquer cet engouement tient au d\u00e9veloppement du mod\u00e8le des plateformes bifaces telles Booking.com ou Uber. Ces derni\u00e8res se positionnent en interm\u00e9diaires entre les acteurs historiques et les clients finaux disruptant ainsi les march\u00e9s traditionnels et red\u00e9finissant la cha\u00eene de valeur. Un tel positionnement central leur permet d\u2019observer l\u2019int\u00e9gralit\u00e9 du march\u00e9 l\u00e0 o\u00f9 les acteurs historiques n\u2019en percevaient souvent qu\u2019une partie. Au c\u0153ur de cette r\u00e9volution se trouvent les donn\u00e9es que ces plateformes accumulent plus vite et en quantit\u00e9 plus importante que les acteurs traditionnels. Elles acqui\u00e8rent ainsi une connaissance, une compr\u00e9hension et finalement une ma\u00eetrise des march\u00e9s inconnues jusqu\u2019alors.<\/p>\n<p>Pour exploiter ces donn\u00e9es et en tirer parti, les Data Scientists sont en premi\u00e8re ligne. Ils sont ainsi en charge de les traiter et les analyser, proposer des indicateurs de suivi, \u00e9tudier l\u2019activit\u00e9 de la plateforme, optimiser les choix strat\u00e9giques\u2026 d\u2019o\u00f9 l\u2019importance de n&rsquo;\u00eatre pas seulement un ex\u00e9cutant et de comprendre les besoins strat\u00e9giques, ainsi que d\u2019avoir une vision transverse des besoins op\u00e9rationnels de toutes les lignes de m\u00e9tiers.<\/p>\n<p>Parmi les sujets sp\u00e9cifiques sur lesquels les data scientists \u00e9conomistes ont un r\u00f4le \u00e0 jouer, on peut citer la correction des biais dans les syst\u00e8mes de notation. Ceux-ci sont en effet au c\u0153ur de la proposition de valeur de nombreuses plateformes pour stimuler la comp\u00e9tition et garantir la qualit\u00e9 de service. Cependant, ces syst\u00e8mes de notations posent de nombreux probl\u00e8mes\u00a0: comment inciter les utilisateurs \u00e0 noter r\u00e9guli\u00e8rement et de mani\u00e8re impartiale\u00a0? Comment s\u2019assurer que la note d\u2019une des parties n\u2019influence pas celle de l\u2019autre partie\u00a0? Comment \u00e9viter la cr\u00e9ation de notes factices\u00a0? Des solutions ont \u00e9t\u00e9 propos\u00e9es, soit au niveau du timing de collecte et de divulgation (par exemple, en ne fournissant que l\u2019\u00e9volution de la note moyenne \u00e0 intervalles r\u00e9guliers), soit en aval, pour redresser les r\u00e9sultats obtenus et tenir compte du fait que certains utilisateurs ont syst\u00e9matiquement tendance \u00e0 noter de mani\u00e8re trop basse ou trop \u00e9lev\u00e9e.<\/p>\n<p>Le champ des besoins est tr\u00e8s vaste et couvre en fait l\u2019ensemble des lignes de m\u00e9tier dont les enjeux business pourraient \u00eatre \u00e9tudi\u00e9s sous l\u2019angle des donn\u00e9es\u00a0: pricing, assortiment, syst\u00e8mes de recommandation, classements, moteurs d\u2019appariement, contrats d&rsquo;exclusivit\u00e9, finance etc.<\/p>\n<h4><strong>Les data scientists \u00e9conomistes aident \u00e0 porter un regard critique sur la valeur des donn\u00e9es<\/strong><\/h4>\n<p>Les donn\u00e9es ont \u00e9videmment une valeur pour leur usage direct, mais \u00e9galement pour les possibilit\u00e9s qu\u2019elles offrent de faire \u00e9voluer le c\u0153ur de m\u00e9tier voire de permettre \u00e0 l\u2019entreprise de pivoter vers de nouvelles activit\u00e9s ou un nouveau secteur.<\/p>\n<p>Une illustration classique de secteur que les donn\u00e9es sont amen\u00e9es \u00e0 bouleverser est le secteur de l\u2019assurance. Aujourd\u2019hui, le mod\u00e8le \u00e9conomique repose sur une r\u00e9ponse aux asym\u00e9tries d\u2019information des assureurs vis-\u00e0-vis des assur\u00e9s (alea moral et anti-s\u00e9lection). Si demain les informations disponibles sont beaucoup plus nombreuses, tout peut changer. On peut ainsi citer l\u2019arriv\u00e9e de capteurs dans les voitures qui vont progressivement permettre de proposer des tarifs v\u00e9ritablement personnalis\u00e9s. La suite de l\u2019histoire est pr\u00e9visible\u00a0: fuite des bons conducteurs vers les assureurs qui proposeront les meilleurs tarifs, hausse du tarif pour ceux qui restent, red\u00e9finition compl\u00e8te de la notion de mutualisation des risques.<\/p>\n<p>Pour les changements de m\u00e9tier, on peut penser \u00e0 des constructeurs automobiles qui se positionnent d\u00e9sormais comme acteurs de la mobilit\u00e9, ou \u00e0 la NFL (National Football League) qui est pass\u00e9e d\u2019un mod\u00e8le d\u2019organisateur de comp\u00e9titions sportives \u00e0 une organisation sous forme de media capable de toucher ses fans 7 jours sur 7 tout au long de l\u2019ann\u00e9e.<\/p>\n<p>La notion de valeur vaut \u00e9galement pour toutes les donn\u00e9es que les entreprises divulguent \u00e0 d\u2019autres acteurs dont elles n\u2019imaginent pas qu\u2019ils pourraient \u00eatre leurs concurrents de demain. C\u2019est le cas dans le domaine de l\u2019intelligence artificielle pour tous les services qui sont externalis\u00e9s aupr\u00e8s d\u2019autres entreprises qui se servent des donn\u00e9es r\u00e9colt\u00e9es pour nourrir leurs algorithmes et am\u00e9liorer ainsi leurs produits aux d\u00e9pens de leurs clients qui les leur fournissent. Dans ce cas, les entreprises historiques s\u2019exposent \u00e0 un risque d\u2019interm\u00e9diation de la part de ces nouveaux acteurs qu\u2019elles auront contribu\u00e9 \u00e0 faire \u00e9merger gr\u00e2ce \u00e0 leurs propres donn\u00e9es.<\/p>\n<h4><strong>Conclusion provisoire<\/strong><\/h4>\n<p>Il y a une vraie valeur ajout\u00e9e \u00e0 faire de la data science avec un \u0153il d&rsquo;\u00e9conomiste et il est indispensable de maintenir cette sp\u00e9cificit\u00e9 pour d\u00e9passer le pur Machine Learning, plus orient\u00e9 code et dont les m\u00e9triques rassurantes peuvent parfois faire passer \u00e0 c\u00f4t\u00e9 des vraies questions. Il faut ma\u00eetriser les outils mais quelqu&rsquo;un qui entraine des mod\u00e8les sans forc\u00e9ment comprendre les enjeux est plus facilement rempla\u00e7able que quelqu&rsquo;un qui sait bien faire parler les donn\u00e9es.<\/p>\n<p>Pour les plus jeunes, il semble donc primordial de conserver la double comp\u00e9tence qui fait la force des profils des ENSAE en se formant \u00e0 la fois au Machine Learning et \u00e0 l\u2019\u00e9conomie.<\/p>\n<p>Pour les plus anciens il n\u2019est pas trop tard pour s\u2019enrichir de l\u2019\u00e9tat d\u2019esprit du Machine Learning et aller au-del\u00e0 des r\u00e9gressions lin\u00e9aires (Lasso\/Ridge, SVM (Support Vector Machine), for\u00eats al\u00e9atoires, boosting, deep learning).<\/p>\n<p>Pour les entreprises, nous pensons qu\u2019il faut suivre l\u2019exemple des plus grosses firmes am\u00e9ricaines de la <em>tech\u00a0<\/em>: int\u00e9grer \u00e0 leurs \u00e9quipes des Data Scientists \u00e9conomistes, penser \u00e0 la valeur des donn\u00e9es, pour le m\u00e9tier actuel, mais aussi pour d\u2019\u00e9ventuels pivots, et enfin penser \u00e0 la valeur des donn\u00e9es de leurs concurrents d\u2019aujourd\u2019hui sans oublier des entreprises qui pourraient venir sur leur march\u00e9 afin d\u2019anticiper les \u00e9volutions du paysage concurrentiel et des march\u00e9s en g\u00e9n\u00e9ral.<\/p>\n<h4><strong>Trois suggestions aux \u00e9conom\u00e8tres de formation voulant se familiariser avec le Machine Learning<\/strong><\/h4>\n<ul>\n<li>S\u2019enrichir de l\u2019\u00e9tat d\u2019esprit et de la culture Machine Learning (notions d\u2019\u00e9chantillons de train et de test, de surapprentissage, technique de validation crois\u00e9e)\u00a0: lire par exemple <em>An Introduction to Statistical Learning with Applications in R<\/em> (<em><span style=\"text-decoration: underline;\"><span style=\"color: #0000ff;\"><a style=\"color: #0000ff; text-decoration: underline;\" href=\"http:\/\/www-bcf.usc.edu\/~gareth\/ISL\/\">http:\/\/www-bcf.usc.edu\/~gareth\/ISL\/<\/a><\/span><\/span><\/em>)<\/li>\n<li>Se former aux logiciels adapt\u00e9s (R, Python) et aux librairies comme scikit-learn<\/li>\n<li>Suivre les liens r\u00e9cents faits par des \u00e9quipes mixtes statisticiens\/\u00e9conomistes pour travailler sur les questions de causalit\u00e9 en lien avec des algorithmes de Machine Learning (cf. par exemple les articles de Susan Athey, Julie Tibshirani et Stefan Wager)<\/li>\n<\/ul>\n<p><em>* Cet article a \u00e9t\u00e9 \u00e9crit \u00e0 partir de la pr\u00e9sentation faite par les auteurs au cours du petit-d\u00e9jeuner Data Science d\u2019ENSAE Alumni du 25 janvier 2019. Les auteurs remercient les participants pour leurs remarques constructives qui ont \u00e9t\u00e9 int\u00e9gr\u00e9es autant que possible au pr\u00e9sent article.<\/em><\/p>\n<hr \/>\n<p><em><a href=\"#_ftnref1\" name=\"_ftn1\">[1]<\/a> Will affirmative-action policies eliminate negative stereotypes ? American Economic Review, 1993<\/em><\/p>\n<p><em><a href=\"#_ftnref2\" name=\"_ftn2\">[2]<\/a> Artificial intelligence, algorithmic pricing and collusion, Center for Economic Policy Research, CEPR, DP 13405<\/em><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Au sein de la grande et r\u00e9cente famille des data scientists, divers profils ont \u00e9merg\u00e9 au-del\u00e0 des traditionnels statisticiens\u00a0: data analystes, data engineers, Kaggle masters, machine learners,\u2026 et depuis quelque temps les data scientists \u00e9conomistes que l\u2019on pourrait \u00e9galement appeler data strategists. Ces derniers poss\u00e8dent des comp\u00e9tences bien sp\u00e9cifiques combinant ma\u00eetrise des outils quantitatifs et [&hellip;]<\/p>\n","protected":false},"author":220,"featured_media":4003,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_et_pb_use_builder":"","_et_pb_old_content":"","_et_gb_content_width":"","_exactmetrics_skip_tracking":false,"_exactmetrics_sitenote_active":false,"_exactmetrics_sitenote_note":"","_exactmetrics_sitenote_category":0,"footnotes":""},"categories":[15,193,135],"tags":[],"class_list":["post-3997","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-data-science","category-selection-mars-2019","category-tribune","et-has-post-format-content","et_post_format-et-post-format-standard"],"_links":{"self":[{"href":"https:\/\/variances.eu\/index.php?rest_route=\/wp\/v2\/posts\/3997","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/variances.eu\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/variances.eu\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/variances.eu\/index.php?rest_route=\/wp\/v2\/users\/220"}],"replies":[{"embeddable":true,"href":"https:\/\/variances.eu\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=3997"}],"version-history":[{"count":0,"href":"https:\/\/variances.eu\/index.php?rest_route=\/wp\/v2\/posts\/3997\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/variances.eu\/index.php?rest_route=\/wp\/v2\/media\/4003"}],"wp:attachment":[{"href":"https:\/\/variances.eu\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=3997"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/variances.eu\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=3997"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/variances.eu\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=3997"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}