{"id":6583,"date":"2022-04-19T07:05:55","date_gmt":"2022-04-19T05:05:55","guid":{"rendered":"https:\/\/variances.eu\/?p=6583"},"modified":"2022-04-19T07:08:00","modified_gmt":"2022-04-19T05:08:00","slug":"compte-rendu-du-webinar-sport-et-data","status":"publish","type":"post","link":"https:\/\/variances.eu\/?p=6583","title":{"rendered":"Compte-rendu du webinar \u00ab Sport et Data \u00bb"},"content":{"rendered":"<p><span style=\"color: #0000ff;\"><strong><em>Le 17 Mars 2021 a eu lieu le webinar en ligne \u00ab\u00a0<\/em><\/strong><strong><em>Sport et Data<\/em><\/strong><strong><em>\u00a0\u00bb co-organis\u00e9 par ENSAE Alumni et ENSAI Alumni. Ce s\u00e9minaire a permis de faire un tour d\u2019horizon de l\u2019utilisation des donn\u00e9es dans le monde du sport\u00a0; illustration d\u2019un th<\/em><\/strong><strong><em>\u00e8me en pleine expansion o<\/em><\/strong><strong><em>\u00f9 les ENSAE et ENSAI s\u2019illustrent pleinement. L\u2019occasion pour Variances de faire un compte-rendu de cette soir\u00e9<\/em><\/strong><strong><em>e.<\/em><\/strong><\/span><\/p>\n<p>Le 17 Mars 2021, le Webinar \u00ab\u00a0Sport et Data\u00a0\u00bb a r\u00e9uni virtuellement une cinquantaine de participants pendant deux heures. L\u2019occasion pour les participants M\u00e9lanie Baconnais (ENSAI 2021), Pierre Miralles (ENSAE 2003), Nolwenn Pinczon du Sel (ENSAI 2021) et Claire Poirson (avocate associ\u00e9e au cabinet Bersay) d\u2019\u00e9changer sur les enjeux sportifs, statistiques et juridiques, actuels comme \u00e0 venir, de l\u2019utilisation de la donn\u00e9e dans le sport professionnel.<\/p>\n<h5><strong><em>Un sujet en pleine expansion<\/em><\/strong><\/h5>\n<p>Les donn\u00e9es ont massivement investi le monde du sport. Tout le monde pense naturellement au football, ce sport \u00e9tant celui ayant le plus d\u2019enjeux financiers et d\u2019enjeux d\u2019opinion\u00a0; mais l\u2019utilisation de la donn\u00e9e dans le sport ne saurait lui \u00eatre restreinte. Crampons intelligents qui mesurent les efforts multilat\u00e9raux pour optimiser la mani\u00e8re de pousser dans une m\u00eal\u00e9e de rugby, paris sportifs, m\u00eame les montres connect\u00e9es port\u00e9es produisent des quantit\u00e9s de donn\u00e9es exploit\u00e9es par les entra\u00eeneurs ou les r\u00e9seaux sociaux sp\u00e9cialis\u00e9s en course \u00e0 pied. L\u2019ENSAE et l\u2019ENSAI ont construit leur r\u00e9putation sur la solidit\u00e9 des formations qu\u2019elles dispensent en data science, statistiques, finance et actuariat. Il est logique d\u00e8s lors de voir des alumni de ces deux \u00e9coles investir des fonctions reli\u00e9es au monde du sport.<\/p>\n<h5><strong><em>Le football, une bonne illustration<\/em><\/strong><\/h5>\n<p>Reprenons \u00e0 titre illustratif le cas du football. La prise de conscience de l\u2019importance des donn\u00e9es est ancienne\u00a0: l\u2019iconique <em>Kick and Rush<\/em> anglais a \u00e9t\u00e9 intronis\u00e9 apr\u00e8s la premi\u00e8re analyste statistique de l\u2019histoire du football. Le livre de Kuper et Szymanski \u00ab\u00a0Soccernomics\u00a0\u00bb (en fran\u00e7ais\u00a0: \u00ab\u00a0Les attaquants les plus chers ne sont pas ceux qui marquent le plus\u00a0\u00bb), publi\u00e9 en 2009, est une introduction canonique au th\u00e8me. Les donn\u00e9es statistiques sont d\u00e9sormais la mati\u00e8re interstitielle dans ce sport. Elles interviennent pour l\u2019analyse de l\u2019entra\u00eenement, l\u2019analyse du match, le recrutement, les paris sportifs. Il y a des sites, de statistiques ou de <em>crowd evaluation<\/em> (Squawka, Transfermarks), des logiciels (Wyscout), des entreprises (Opta, Stats), des experts pour chacun des th\u00e8mes pr\u00e9cit\u00e9s. Dans les faits, se demander si le football peut \u00eatre soluble dans les statistiques (ou si l\u2019on peut totalement mod\u00e9liser le football) n\u2019est probablement pas la bonne question.\u00a0 C\u2019est du reste pour cela que malgr\u00e9 une omnipr\u00e9sence, la fusion totale entre donn\u00e9e et terrain ne s\u2019est pas encore op\u00e9r\u00e9e. Mais la disponibilit\u00e9 de ces donn\u00e9es pose d\u2019autres questions\u00a0; savoir notamment qui est propri\u00e9taire de ces donn\u00e9es\u00a0: l\u2019athl\u00e8te\u00a0? le club\u00a0? le diffuseur\u00a0? le stade\u00a0? Et pour cela, le probl\u00e8me n\u2019est \u00e9videmment pas restreint au football.<\/p>\n<h5><strong><em>D\u00e9roulement du Webinar<\/em><\/strong><\/h5>\n<p><strong>M\u00e9lanie Baconnais<\/strong>\u00a0(ENSAI 2021) est <em>Data Scientist<\/em>\u00a0et a d\u00e9velopp\u00e9 un int\u00e9r\u00eat pour le sport au cours de ses \u00e9tudes. M\u00e9lanie travaille en collaboration avec l&rsquo;Institut de Recherche bioM\u00e9dicale et d\u2019Epid\u00e9miologie du Sport (IRMES) de l&rsquo;INSEP. Elle a entre autres pour mission d&rsquo;\u00e9tudier les facteurs de performance des athl\u00e8tes paralympiques. L\u2019INSEP, institut public, travaille en particulier avec les athl\u00e8tes qui participent aux Jeux Paralympiques (pour 13 des 22 sports, soit 75 % des m\u00e9dailles acquises \u00e0 Rio en 2016). L&rsquo;objectif en vue de Paris 2024 est d\u2019optimiser le parcours sportif de chaque athl\u00e8te fran\u00e7ais, en \u00e9valuant la charge d\u2019entra\u00eenement et les donn\u00e9es de performance, pour fournir un accompagnement chiffr\u00e9 aux athl\u00e8tes et \u00e0 leur staff. M\u00e9lanie travaille dans ce contexte pour le projet PARAPERF et se concentre notamment sur l\u2019\u00e9preuve de tir au pistolet.<\/p>\n<p>Le sujet est particulier mais tr\u00e8s int\u00e9ressant car contrairement \u00e0 des sports plus m\u00e9diatiques, les donn\u00e9es sont par nature moins disponibles. Il s\u2019agit essentiellement de donn\u00e9es de comp\u00e9tition, non de donn\u00e9es d\u2019entra\u00eenement. En particulier, pas de GPS ou de vid\u00e9o comme en football. Le suivi et la constitution des jeux de donn\u00e9es se fait essentiellement \u00e0 la main, en d\u00e9cortiquant semi-automatiquement des fichiers pdf disponibles sur des sites sp\u00e9cialis\u00e9s. Rien d\u2019automatique au sens o\u00f9 la donn\u00e9e de base n\u2019existe pas et est incompl\u00e8te. En particulier, la nature du handicap des athl\u00e8tes est en g\u00e9n\u00e9ral inconnue. M\u00e9lanie a donc essentiellement pr\u00e9sent\u00e9 des cas d\u2019usage dans le cas du tir au pistolet o\u00f9 les enjeux sont de permettre aux athl\u00e8tes de prioriser les \u00e9preuves, les aider \u00e0 se situer dans un contexte concurrentiel et \u00e0 se qualifier le cas \u00e9ch\u00e9ant, ou comment sciemment abandonner certaines \u00e9preuves pour mieux se concentrer sur d\u2019autres. La mission de base du <em>Data Scientist<\/em> reste d\u2019analyser les performances, de cibler un potentiel de m\u00e9dailles, d\u2019identifier les d\u00e9terminants de la progression et surtout de restituer l\u2019information au staff. C\u2019est l\u00e0 l\u2019essentiel et le plus difficile. Il faut donner des outils de visualisation, cl\u00e9 en main. Les athl\u00e8tes ont peu de culture statistique, peu de temps \u00e0 consacrer \u00e0 ces retours, donc les moments de contact, qui se font avec le staff, doivent \u00eatre efficaces, visuels et concis. Il n\u2019y a pas d\u2019interf\u00e9rence dans le lien staff-athl\u00e8te, c\u2019est toujours l\u2019entra\u00eeneur national ou le staff qui reste la personne cl\u00e9 pour l\u2019athl\u00e8te. Ces derniers n\u2019ont pas assez de recul sur leur pratique si le message qui leur est fourni est trop direct ou trop d\u00e9contextualis\u00e9. Les entra\u00eeneurs sont donc les destinataires du message chiffr\u00e9.<\/p>\n<p><strong>Pierre Miralles<\/strong> (ENSAE 2003) est dipl\u00f4m\u00e9 de l\u2019Ecole Polytechnique et de l\u2019ENSAE (Promotion 2003). Apr\u00e8s plus de 10 ans d\u2019analyse quantitative en finance de march\u00e9, Pierre a co-fond\u00e9 en 2014 Footovision dont le c\u0153ur de m\u00e9tier est d\u2019extraire et d\u2019analyser des donn\u00e9es de matches de football pour proposer aux acteurs de ce sport une aide \u00e0 la d\u00e9cision statistique et quantitative.<\/p>\n<p>Outre les enjeux financiers, le champ d\u2019application de la science dans le football est \u00e9norme car le football est un sport dynamique. Contrairement \u00e0 d\u2019autres sports comme le baseball, les degr\u00e9s de libert\u00e9 sont extr\u00eamement nombreux et les probabilit\u00e9s sont plus dures \u00e0 mod\u00e9liser. L\u2019importance de la reconnaissance visuelle par ordinateur est cruciale pour analyser toute la donn\u00e9e dans son contexte, et pas seulement la donn\u00e9e \u00ab\u00a0autour du ballon\u00a0\u00bb. Les trois autres champs investis par Footovision sont l\u2019Intelligence Artificielle, la <em>Data Science<\/em> (un match g\u00e9n\u00e8re environ 5Go de donn\u00e9es) et <em>la Business Intelligence<\/em>. Travaillant jusqu\u2019\u00e0 pr\u00e9sent avec des donn\u00e9es de matches termin\u00e9s, une des ambitions de Footovision est de fournir un jour une solution en temps r\u00e9el. Les clubs utilisent les licences Footovision pour suivre leur propre \u00e9quipe, analyser leur futur adversaire, ou \u00e9tayer les entretiens individuels et des analyses avec les joueurs. La composante de reconnaissance des actions par ordinateur est utilis\u00e9e par les m\u00e9dias et les diffuseurs pour animer et habiller les images (palettes, cerclages etc.). Une application potentielle serait de fournir en temps r\u00e9el un rendu 2D d\u2019un match pour les cha\u00eenes n\u2019ayant pas de droits de retransmission. Pierre a pr\u00e9sent\u00e9 de nombreux aspects et cas d\u2019usages. Nous avions d\u00e9j\u00e0 eu un entretien avec lui il y a quelques mois, entretien que nous vous invitons \u00e0 retrouver ici (<span style=\"text-decoration: underline;\"><span style=\"color: #0000ff;\"><a style=\"color: #0000ff; text-decoration: underline;\" href=\"https:\/\/variances.eu\/?p=6038\">https:\/\/variances.eu\/?p=6038<\/a><\/span><\/span>).<\/p>\n<p><strong>Nolwenn Pinczon du Sel<\/strong> (ENSAI 2021) est elle aussi <em>Data Scientist <\/em>et travaille pour la F\u00e9d\u00e9ration Fran\u00e7aise de Rugby apr\u00e8s avoir travaill\u00e9 pour l\u2019INSEP et la F\u00e9d\u00e9ration Fran\u00e7aise de Boxe. Nolwenn a commenc\u00e9 par insister sur la sp\u00e9cificit\u00e9 de l\u2019organisation interne du staff de l\u2019\u00e9quipe de France. La F\u00e9d\u00e9ration, en appui avec son s\u00e9lectionneur, a instaur\u00e9 un fonctionnement mim\u00e9tique et vertical. Si la priorit\u00e9 est \u00e9videmment donn\u00e9e \u00e0 l\u2019\u00e9quipe A, par rapport aux \u00e9quipes de jeunes, tous les staffs ont sch\u00e9matiquement les m\u00eames fonctionnements, les m\u00eames exigences, et les m\u00eames supports (statistiques, jeu, nutrition, m\u00e9dical, etc.). En particulier, le travail de l\u2019\u00e9quipe d\u2019analystes peut ainsi profiter \u00e0 tous. Les r\u00e9cents succ\u00e8s de l\u2019\u00e9quipe (Grand Chelem dans le Tournoi des 6 Nations 2022) sont donc probablement tout sauf un hasard\u00a0: la synergie entre les staffs et les \u00e9quipes d\u2019analystes est grande. Il s\u2019agit donc de produire des indicateurs de performance tout en s\u2019adaptant \u00e0 chaque staff. L\u2019\u00e9quipe s\u2019appuie sur des donn\u00e9es tactiques (\u00e0 partir de vid\u00e9os encod\u00e9es par leur partenaire, l\u2019entreprise STATS) et sur des donn\u00e9es physiques (l\u00e0 encore GPS, tests, donn\u00e9es cardiologiques, marqueurs biologiques). Mais aussi (et c\u2019est l\u00e0 la particularit\u00e9 de ce fonctionnement global) des questionnaires subjectifs pour les joueurs sur leur ressenti concernant leur ressenti des charges \u00e9motionnelles et physiques auxquelles ils font face. Les pr\u00e9rogatives de l\u2019\u00e9quipe permettent entre autres d\u2019adapter l\u2019entra\u00eenement, d\u2019assister les analystes du jeu, de cibler les joueurs \u00e0 s\u00e9lectionner, de suivre la charge effective et per\u00e7ue, et \u00e9videmment de pr\u00e9venir les blessures.<\/p>\n<p>Si l\u2019on devait structurer les apports du groupe de <em>Data Scientists<\/em> pour l\u2019\u00e9quipe de France, il y aurait selon Nolwenn trois axes principaux. Premi\u00e8rement, il s\u2019agit de cr\u00e9er un outil de suivi pour avoir un retour objectif sur le r\u00e9alis\u00e9. En d\u2019autres termes, faire ressortir les qualit\u00e9s individuelles tout en v\u00e9rifiant que les s\u00e9ances physiques et techniques sont bien respect\u00e9es. Deuxi\u00e8mement, il s\u2019agit d\u2019analyser la performance en match, des joueurs de l\u2019\u00e9quipe mais aussi des adversaires, et ce au niveau collectif comme individuel. Pour ce dernier aspect, comme il n\u2019est pas appr\u00e9hend\u00e9 par les <em>data providers<\/em>, des experts vid\u00e9o rugby restent n\u00e9cessaire, ces derniers s\u2019appuyant appui sur des extraits vid\u00e9o. Enfin, le troisi\u00e8me th\u00e8me (qui a fourni un cas d\u2019usage pr\u00e9sent\u00e9 en d\u00e9tail par Nolwenn) est l\u2019analyse du jeu, tout particuli\u00e8rement le jeu au pied.<\/p>\n<p><strong>Claire Poirson<\/strong> est avocate associ\u00e9e du cabinet Bersay. Claire est sp\u00e9cialis\u00e9e dans la gestion juridique des donn\u00e9es, de la propri\u00e9t\u00e9 intellectuelle aux probl\u00e9matiques IT. Les enjeux juridiques principaux sur l\u2019utilisation de la donn\u00e9e sont au nombre de trois\u00a0: la protection de la vie priv\u00e9e et du droit \u00e0 l\u2019image\u00a0; la protection de la vie professionnelle (ceci est directement li\u00e9 \u00e0 la carri\u00e8re professionnelle et reste un aspect qui s\u2019apparente au droit de la sant\u00e9 des professionnels)\u00a0; enfin le dernier enjeu est l\u2019usage commercial des donn\u00e9es personnelles (et il encapsule l\u2019encadrement de la collecte et de l\u2019utilisation des donn\u00e9es personnelles \u00e0 usage commercial). Un exemple frappant est qu\u2019au Royaume-Uni, 850 footballeurs ont mis en demeure 17 entreprises de paris sportifs pour utilisation sans leur consentement de leurs donn\u00e9es de performance (1). Reste \u00e0 qualifier juridiquement la donn\u00e9e. Les donn\u00e9es classiques sont tout ce qui permet d\u2019identifier une personne. La collecte de donn\u00e9es classiques est autoris\u00e9e mais est soumise \u00e0 conditions. Les finalit\u00e9s doivent \u00eatre d\u00e9finies et les sportifs inform\u00e9s. Les donn\u00e9es de sant\u00e9 ne peuvent quant \u00e0 elles \u00eatre collect\u00e9es sauf exception. Le acteurs collectant ces derni\u00e8res sont soumis \u00e0 des obligations sp\u00e9cifiques\u00a0; une interdiction de cession \u00e0 titre on\u00e9reux s\u2019applique en g\u00e9n\u00e9ral pour les donn\u00e9es de sant\u00e9.<\/p>\n<h5><strong><em>Conclusion<\/em><\/strong><\/h5>\n<p>Les donn\u00e9es sont de plus en plus pr\u00e9sentes dans le sport. En cons\u00e9quence, les profils de <em>Data Scientists<\/em> sont aussi plus nombreux dans les clubs, mais aussi dans les f\u00e9d\u00e9rations. L\u2019utilisation de la donn\u00e9e n\u2019est pas confin\u00e9e au football. Si les sp\u00e9cificit\u00e9s de ce sport font que sa mod\u00e9lisation reste un \u00e9norme d\u00e9fi, les statistiques s\u2019infiltrent dans de nombreux sports, du rugby au tir au pistolet, et pas seulement pour les sportifs valides\u00a0! Le but restera cependant de fournir une aide \u00e0 la d\u00e9cision aux staffs et entra\u00eeneurs. Pour ne pas \u00ab\u00a0brusquer\u00a0\u00bb les acteurs du milieu, il faut encore les habituer au discours statistique. Mais ces acteurs sont eux-m\u00eames partie prenante de la d\u00e9marche. Pour une bonne entente, le d\u00e9fi essentiel est de les guider pour les aider dans la prise de recul sans les remplacer dans leur m\u00e9tier au quotidien. Le <em>Data Scientist<\/em> doit traiter des donn\u00e9es de plus en plus compl\u00e8tes et vari\u00e9es, objectiver les <em>a priori<\/em> des sportifs, et fournir des outils d\u2019aide aux experts.<\/p>\n<hr \/>\n<h5><strong><em>Notes<\/em><\/strong><\/h5>\n<p style=\"padding-left: 40px;\">(1) M\u00eame si ceci n\u2019est pas directement li\u00e9 aux donn\u00e9es statistiques, les enjeux financiers sont devenus tels que les joueurs et leur entourage cherchent actuellement \u00e0 reprendre le contr\u00f4le sur tous les aspects de leur image. En t\u00e9moignent les actions pour collecter plus de droits sur les images autocollantes, les licences de jeux vid\u00e9o, ou les contrats publicitaires n\u00e9goci\u00e9s globalement par les f\u00e9d\u00e9rations au nom des \u00e9quipes nationales.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Le 17 Mars 2021 a eu lieu le webinar en ligne \u00ab\u00a0Sport et Data\u00a0\u00bb co-organis\u00e9 par ENSAE Alumni et ENSAI Alumni. Ce s\u00e9minaire a permis de faire un tour d\u2019horizon de l\u2019utilisation des donn\u00e9es dans le monde du sport\u00a0; illustration d\u2019un th\u00e8me en pleine expansion o\u00f9 les ENSAE et ENSAI s\u2019illustrent pleinement. L\u2019occasion pour Variances [&hellip;]<\/p>\n","protected":false},"author":308,"featured_media":6584,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_et_pb_use_builder":"","_et_pb_old_content":"","_et_gb_content_width":"","_exactmetrics_skip_tracking":false,"_exactmetrics_sitenote_active":false,"_exactmetrics_sitenote_note":"","_exactmetrics_sitenote_category":0,"footnotes":""},"categories":[15,137],"tags":[],"class_list":["post-6583","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-data-science","category-sport","et-has-post-format-content","et_post_format-et-post-format-standard"],"_links":{"self":[{"href":"https:\/\/variances.eu\/index.php?rest_route=\/wp\/v2\/posts\/6583","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/variances.eu\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/variances.eu\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/variances.eu\/index.php?rest_route=\/wp\/v2\/users\/308"}],"replies":[{"embeddable":true,"href":"https:\/\/variances.eu\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=6583"}],"version-history":[{"count":0,"href":"https:\/\/variances.eu\/index.php?rest_route=\/wp\/v2\/posts\/6583\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/variances.eu\/index.php?rest_route=\/wp\/v2\/media\/6584"}],"wp:attachment":[{"href":"https:\/\/variances.eu\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=6583"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/variances.eu\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=6583"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/variances.eu\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=6583"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}