{"id":2244,"date":"2017-05-19T08:53:03","date_gmt":"2017-05-19T06:53:03","guid":{"rendered":"http:\/\/variances.eu\/?p=2244"},"modified":"2017-05-19T09:23:04","modified_gmt":"2017-05-19T07:23:04","slug":"mathematique-statistique-sport","status":"publish","type":"post","link":"https:\/\/variances.eu\/?p=2244","title":{"rendered":"Pour la math\u00e9matique statistique dans le sport"},"content":{"rendered":"<p><span style=\"color: #0000ff;\">\u00a0<strong>Entretien avec Philippe Tassi, avril 2017<\/strong><\/span><\/p>\n<hr \/>\n<p><span style=\"color: #0000ff;\"><strong>Philippe Tassi\u00a0:<em> Jean-Louis, vous avez une carri\u00e8re brillante de chercheur \u00e0 l\u2019INRA, et depuis 5 ans vous \u00eates \u00e0 l\u2019IMAG de Montpellier. En janvier 2014, vous avez pr\u00e9sent\u00e9 une communication passionnante sur une approche bay\u00e9sienne de la pr\u00e9vision et du classement en football lors du premier colloque organis\u00e9 sur le th\u00e8me du sport par la Soci\u00e9t\u00e9 Fran\u00e7aise de Statistique. Pour quelles raisons en \u00eates-vous venu \u00e0 vous int\u00e9resser \u00e0 la statistique du sport\u00a0?<\/em><\/strong><\/span><\/p>\n<p><span style=\"color: #993300;\"><strong>Jean-Louis Foulley<\/strong><\/span>\u00a0: Il y eut d\u2019abord la n\u00e9cessit\u00e9 de faire quelque chose apr\u00e8s une retraite forc\u00e9e et probablement une attirance pour quelque chose de vraiment diff\u00e9rent, une sorte de d\u00e9fi de d\u00e9butant ainsi que la curiosit\u00e9 de s\u2019attaquer \u00e0 un domaine insolite pour le monde de la recherche, du moins en France.<\/p>\n<p><span style=\"color: #0000ff;\"><strong>PT\u00a0: <em>Mais dans quel contexte\u00a0abordiez vous cette r\u00e9orientation ?<\/em><\/strong><\/span><\/p>\n<p><span style=\"color: #993300;\"><strong>JLF<\/strong><\/span>\u00a0: En fait, le contexte \u00e9tait et reste toujours tr\u00e8s favorable. Tout le monde s\u2019accorde \u00e0 constater que le sport est un secteur en pleine expansion pour de multiples raisons \u00e0 la fois \u00e9conomiques et sociales. Il est aussi un domaine de pr\u00e9dilection pour le num\u00e9rique et la quantification qu\u2019il s\u2019agisse de statistiques descriptives, de pronostics, de paris, de cotes, de classements, d\u2019\u00e9valuations ou de diagnostics en tout genre.<\/p>\n<p>Tout d\u2019abord, il y a, et il y aura de plus en plus, pl\u00e9thore de donn\u00e9es concernant \u00e0 la fois les performances des sportifs, mais aussi celles relatives au d\u00e9roulement des \u00e9preuves (donn\u00e9es vid\u00e9o notamment), \u00e0 la pr\u00e9paration physique et au suivi des athl\u00e8tes pendant et hors comp\u00e9tition, au coaching et \u00e0 la strat\u00e9gie de jeu ou de comp\u00e9tition.<\/p>\n<p>L\u2019abondance de donn\u00e9es de qualit\u00e9 permet de mettre en \u0153uvre des analyses quantitatives pour lesquelles les math\u00e9matiques, et notamment la statistique, constituent des outils de choix en vue de la description et de la mod\u00e9lisation des ph\u00e9nom\u00e8nes sous-jacents. La palette des m\u00e9thodologies pouvant \u00eatre mises en jeu est elle-m\u00eame tr\u00e8s vaste, allant de la th\u00e9orie des processus stochastiques aux mod\u00e8les hi\u00e9rarchiques bay\u00e9siens complexes en passant par l\u2019analyse des donn\u00e9es, l\u2019analyse de r\u00e9seaux via les mod\u00e8les graphiques ainsi que les techniques dites de <em>machine learning<\/em>. La statistique et le sport devraient donc faire bon m\u00e9nage pourvu qu\u2019on s\u2019y int\u00e9resse sans trop d\u2019arri\u00e8re-pens\u00e9es.<\/p>\n<p><span style=\"color: #0000ff;\"><strong>PT\u00a0: <em>Qu\u2019en est-il du monde de la Recherche \u00e0 cet \u00e9gard\u00a0?<\/em><\/strong><\/span><\/p>\n<p><strong><span style=\"color: #993300;\">JLF<\/span>\u00a0<\/strong>: Certains pays comme les Etats-Unis, le Royaume Uni et les Pays-Bas, ont depuis longtemps une forte implication de leurs unit\u00e9s de recherche en statistique dans le domaine du sport. Ils sont suivis maintenant par d\u2019autres en Europe comme l\u2019Allemagne, l\u2019Italie et l\u2019Espagne. En France, l\u2019engagement des statisticiens se manifeste pour l\u2019instant surtout par des initiatives individuelles, comme les expos\u00e9s de la journ\u00e9e \u00ab\u00a0Quand la statistique a rendez vous avec le sport\u00a0\u00bb que vous avez mentionn\u00e9e dans votre premi\u00e8re question, et publi\u00e9s dans le journal de la SFdS en 2015, volume 156.<\/p>\n<p>Je pense en outre \u00e0 la place accord\u00e9e au domaine sportif dans les soci\u00e9t\u00e9s acad\u00e9miques de statistique comme c\u2019est le cas par exemple de la section Sport de l\u2019<em>American Statistical Association<\/em> (ASA) depuis 1992 et du comit\u00e9 sp\u00e9cialis\u00e9 Statistique Sportive de l\u2019<em>International Statistical Institute<\/em> (ISI). Preuve en est aussi l\u2019existence de revues sp\u00e9cialis\u00e9es telles que le \u00ab\u00a0<em>Journal of Quantitative Analysis of Sports\u00bb<\/em>, premi\u00e8re revue qui publie des travaux de recherche ou de vulgarisation \u00e0 nette orientation statistique touchant la plupart des disciplines sportives qu\u2019elles soient individuelles ou collectives et qui s\u2019\u00e9tendent aussi \u00e0 d\u2019autres sciences comme l\u2019\u00e9conomie, le management, la psychologie, int\u00e9ress\u00e9es par le sujet. Par ailleurs, certaines revues g\u00e9n\u00e9ralistes telles que \u00ab\u00a0<em>Chance<\/em>\u00a0\u00bb, \u00ab\u00a0<em>The American Statistician<\/em>\u00a0\u00bb \u00a0et <em>\u00ab\u00a0Significance\u00a0\u00bb <\/em>consacrent \u00e9galement une place non n\u00e9gligeable \u00e0 la litt\u00e9rature sportive qu\u2019il s\u2019agisse d\u2019applications de certaines m\u00e9thodes ou de questions pos\u00e9es \u00e0 l\u2019occasion de grandes manifestations sportives comme les JO, la Coupe du monde de football, les Play-offs de NBA, etc\u2026. A cela s\u2019ajoutent nombre de sites internet d\u00e9di\u00e9s au sport pr\u00e9sentant principalement des statistiques d\u00e9taill\u00e9es sur les comp\u00e9titions et les athl\u00e8tes qui y participent.<\/p>\n<p><span style=\"color: #0000ff;\"><strong>PT\u00a0: <em>Vous venez d\u2019\u00e9voquer les facteurs de l\u2019offre statistique, qu\u2019en est-il de la demande\u00a0?<\/em><\/strong><\/span><\/p>\n<p><strong><span style=\"color: #993300;\">JLF<\/span>\u00a0<\/strong>: Pour r\u00e9pondre \u00e0 votre question il faut replacer le sport et les diverses activit\u00e9s qui s\u2019y rattachent dans leur contexte \u00e9conomique et social sachant que c\u2019est l\u2019ajustement entre l\u2019offre et la demande qui va remodeler le profil des \u00ab\u00a0data scientists\u00a0\u00bb officiant dans le sport. L\u2019ouvrage d\u2019Andy Hyeans \u00ab\u00a0<em>Sport Data Revolution<\/em>\u00a0\u00bb aborde cette question en d\u00e9tail.<\/p>\n<p>Pour sch\u00e9matiser, je distinguerai le sport de prestige qui requiert des investissements importants en termes de mat\u00e9riel, d\u2019\u00e9quipements, d\u2019infrastructures et qui g\u00e9n\u00e8re aussi en retour des retomb\u00e9es consid\u00e9rables au niveau des retransmissions TV et du march\u00e9 publicitaire. L\u00e0, se manifeste une demande non seulement pour des pronostics et des classements en tout genre, mais aussi pour du profilage d\u2019\u00e9quipes, de joueurs et de strat\u00e9gies de jeu et de coaching ainsi que de suivi physiologique et biom\u00e9canique des athl\u00e8tes.<\/p>\n<p>En outre, le sport de haut niveau comme celui de loisir fait de plus en plus appel \u00e0 d\u2019\u00e9quipements connect\u00e9s tels les smartphones, GPS, bracelets, montres, maillots, raquettes, chaussures\u00a0; ils n\u00e9cessitent des logiciels d\u2019applications intelligents qui s\u2019appuient sur des concepts et mod\u00e8les statistiques.<\/p>\n<p>Une autre facette du sport qui demande un apport de la statistique consiste en l\u2019\u00e9tude des techniques de d\u00e9tection directe ou indirecte des tricheries et notamment du dopage et de ses effets sur les performances et la sant\u00e9, et plus g\u00e9n\u00e9ralement en la mod\u00e9lisation des m\u00e9canismes de physiologie sportive. Il faut suivre, par exemple, l\u2019association AFT \u00ab\u00a0<em>Athletes for Transparency<\/em>\u00a0\u00bb.<\/p>\n<p>Enfin, il faut bien admettre que le sport a la vertu de pouvoir rassembler au-del\u00e0 des fronti\u00e8res disciplinaires et sociales habituelles et ce n\u2019est pas l\u00e0 un de ses moindres m\u00e9rites.<\/p>\n<p><span style=\"color: #0000ff;\"><strong>PT\u00a0: <em>Voil\u00e0 un panorama bien fourni des applications de la statistique. Mais vous-m\u00eame dans quel domaine vous \u00eates-vous sp\u00e9cialis\u00e9\u00a0? <\/em><\/strong><\/span><\/p>\n<p><span style=\"color: #993300;\"><strong>JLF<\/strong><\/span>\u00a0: Le qualificatif de sp\u00e9cialisation est un peu trop fort car mes pr\u00e9tentions \u00e9taient beaucoup plus modestes. Etudiant, j\u2019ai jou\u00e9 au basket et j\u2019en ai gard\u00e9 une attirance naturelle vers les sports collectifs de ballon. Ayant eu aussi la chance d\u2019avoir pu b\u00e9n\u00e9ficier des enseignements en probabilit\u00e9 et statistique th\u00e9orique et appliqu\u00e9e, notamment \u00e0 la g\u00e9n\u00e9tique, de Guy Lefort, d\u2019Albert Jacquard, de Gustave Mal\u00e9cot et de Charles Henderson et de ses \u00e9l\u00e8ves comme Larry Schaeffer ou disciples tel Daniel Gianola, je me suis naturellement orient\u00e9 vers tout ce qui concerne l\u2019\u00e9valuation, le classement d\u2019\u00e9quipes et la pr\u00e9diction de r\u00e9sultats de matches et comp\u00e9titions en me focalisant d\u2019abord sur le football. Qui n\u2019a pas vibr\u00e9 lors de la demi-finale France-Allemagne de S\u00e9ville en 1982 ou pour la victoire de la France en finale contre le Br\u00e9sil au stade de France en 1998\u00a0!<\/p>\n<p><span style=\"color: #0000ff;\"><strong>PT\u00a0: <em>Concr\u00e8tement, qu\u2019en est-il des applications de la statistique aux comp\u00e9titions de football\u00a0?<\/em> <\/strong><\/span><\/p>\n<p><strong><span style=\"color: #993300;\">JLF<\/span>\u00a0<\/strong>: Je me suis jet\u00e9 \u00e0 l\u2019eau en m\u2019attaquant en septembre 2012 \u00e0 l\u2019analyse de la phase finale du championnat d\u2019Europe des nations, comp\u00e9tition tr\u00e8s relev\u00e9e en l\u2019occurrence puisqu\u2019elle a oppos\u00e9 en finale l\u2019Espagne, vainqueur de la coupe du monde 2010 \u00e0 l\u2019Italie, finaliste en 2008. J\u2019avais not\u00e9 au passage que l\u2019UEFA ne fournissait ni classement g\u00e9n\u00e9ral des 16 \u00e9quipes qui participaient \u00e0 cette phase finale de la comp\u00e9tition, ni m\u00eame de podium des trois premiers comme cela se fait par exemple dans d\u2019autres sports comme le handball.<\/p>\n<p>Curieusement le podium auquel mes calculs aboutissaient \u00e9tait form\u00e9 du vainqueur l\u2019Espagne, mais aussi en deuxi\u00e8me et troisi\u00e8me positions de l\u2019Allemagne et du Portugal, \u00e9quipes demi-finalistes. L\u2019Italie ne s\u2019\u00e9tait qualifi\u00e9e qu\u2019aux tirs aux buts en quarts de finales apr\u00e8s un maigre 0-0 contre l\u2019Angleterre et n\u2019avait termin\u00e9 qu\u2019en second rang de son groupe, devanc\u00e9e par l\u2019Espagne. L\u2019\u00e9tablissement d\u2019un simple classement \u00e9tait donc probl\u00e9matique. Depuis lors, j\u2019ai continu\u00e9 \u00e0 analyser l\u2019EURO des nations, la coupe du monde ainsi que la ligue des champions, nouveau nom de l\u2019ancienne coupe d\u2019Europe des clubs champions cr\u00e9\u00e9e en 1955.<\/p>\n<p>Dans ces comp\u00e9titions, je me suis focalis\u00e9 sur deux objectifs\u00a0: le premier est le classement des \u00e9quipes et le second les pronostics des r\u00e9sultats des matches.<\/p>\n<p>En mati\u00e8re de classement, on dispose \u00e0 la fois d\u2019\u00e9valuations officielles \u00e9manant des f\u00e9d\u00e9rations UEFA et FIFA ainsi que d\u2019\u00e9valuations \u00ab\u00a0priv\u00e9es\u00a0\u00bb publi\u00e9es par divers sites internet tels que\u00a0\u00ab\u00a0footballdatabase.com\u00a0\u00bb, \u00ab\u00a0clubworldranking.com\u00a0\u00bb, \u00ab\u00a0clubelo.com\u00a0\u00bb pour les clubs et \u00abeloratings.net\u00a0\u00bb pour les \u00e9quipes nationales.<\/p>\n<p>Pour les non-sp\u00e9cialistes, il faut d\u2019abord rappeler que les classements officiels r\u00e9pondent \u00e0 une triple fonction\u00a0: d\u2019abord, \u00e9tablir une hi\u00e9rarchie mondiale des \u00e9quipes qui offre un billet d\u2019entr\u00e9e aux diverses phases des comp\u00e9titions de prestige\u00a0; ensuite, d\u00e9terminer des groupes \u00e9quilibr\u00e9s pour les tournois de rondes, comme le \u00ab\u00a0Round Robin\u00a0\u00bb, qui constituent la premi\u00e8re \u00e9tape des phases finales des grandes comp\u00e9titions entre nations ou entre clubs par tirage au sort dans des \u00ab\u00a0chapeaux\u00a0\u00bb de valeur d\u00e9croissante, lire par exemple Guyon, 2014 ; et enfin servir de variables pr\u00e9dictrices des r\u00e9sultats des matches \u00e0 venir.<\/p>\n<p>Le classement mondial FIFA, par exemple, est un syst\u00e8me \u00e0 points qui int\u00e8gre en un produit de facteurs\u00a0: le nombre de points par match, l\u2019importance du match, le niveau de l\u2019\u00e9quipe adverse et celui de la zone g\u00e9ographique. L\u2019\u00e9valuation finale d\u00e9coule de la moyenne des points obtenus lors des 4 derni\u00e8res ann\u00e9es selon des coefficients d\u00e9croissants des ann\u00e9es les plus r\u00e9centes aux plus anciennes allant de 1, 0.5, 0.3 \u00e0 0.2. Il est vrai que ce classement a \u00e9t\u00e9 fortement critiqu\u00e9 du fait de son faible pouvoir pr\u00e9dictif comme l\u2019ont montr\u00e9 diverses \u00e9tudes notamment celle de McHale et Davis publi\u00e9e dans le livre <strong>d\u2019Albert et Koning en 2008. <\/strong><\/p>\n<p><span style=\"color: #0000ff;\"><strong>PT\u00a0: <em>Comment cela s\u2019explique-t-il\u00a0?<\/em><\/strong><\/span><\/p>\n<p><strong><span style=\"color: #993300;\">JLF<\/span>\u00a0<\/strong>: Il y a plusieurs raisons \u00e0 cela. Sans rentrer dans le d\u00e9tail, ce type de classement p\u00eache par une mauvaise prise en compte, d\u2019une part, de toutes les confrontations deux \u00e0 deux entre \u00e9quipes et, d\u2019autre part, de l\u2019\u00e9volution de la valeur des \u00e9quipes dans le temps. La FIFA a tent\u00e9 en 2006 de corriger ce dernier point en n\u2019incluant dans son classement que les 4 derni\u00e8res ann\u00e9es au lieu des 8 pr\u00e9c\u00e9demment. Personnellement, j\u2019y vois aussi le risque encouru par l\u2019usage de formules empiriques compliqu\u00e9es qui ne d\u00e9coulent pas d\u2019une mod\u00e9lisation math\u00e9matique claire des observations. Et c\u2019est l\u00e0 o\u00f9 la th\u00e9orie statistique bas\u00e9e sur des hypoth\u00e8ses pr\u00e9cises exprim\u00e9es par des lois probabilistes peut apporter beaucoup pour rationaliser l\u2019\u00e9tablissement des classements. Le m\u00eame ph\u00e9nom\u00e8ne a \u00e9t\u00e9 observ\u00e9 dans d\u2019autres secteurs d\u2019application. Je fais r\u00e9f\u00e9rence ici, par exp\u00e9rience personnelle, au mode d\u2019\u00e9valuation des reproducteurs en s\u00e9lection animale, mode qui n\u2019a pu se d\u00e9p\u00eatrer d\u2019algorithmes de plus en plus complexes et arbitraires que par l\u2019adoption progressive mais d\u00e9finitive du BLUP, c\u2019est-\u00e0-dire du <em>Best Linear Unbiased Prediction<\/em> d\u2019Henderson d\u00e9velopp\u00e9 pour les mod\u00e8les lin\u00e9aires \u00e0 effets al\u00e9atoires.<\/p>\n<p>Pour revenir au probl\u00e8me du classement des \u00e9quipes de football, un premier pas d\u00e9cisif a \u00e9t\u00e9 effectu\u00e9 par l\u2019application du classement ELO, ainsi nomm\u00e9 en l\u2019honneur du physicien hongrois Arpad Elo (1903-1992) qui l\u2019a invent\u00e9 et fait adopter dans les ann\u00e9es 1960-70 pour les joueurs d\u2019\u00e9checs dont il \u00e9tait un grand ma\u00eetre. Cet apport fut d\u00e9cisif dans la rationalisation des classements appliqu\u00e9s aux sports et autres jeux comme l\u2019a bien montr\u00e9 R\u00e9mi Coulom dans son article publi\u00e9 dans \u00ab\u00a0Pour La Science\u00a0\u00bb en 2010. La m\u00e9thode ELO lie la probabilit\u00e9 de victoire P(AB) d\u2019une \u00e9quipe A sur une \u00e9quipe B \u00e0 la diff\u00e9rence d\u2019indices de force des deux \u00e9quipes en pr\u00e9sence,\u00a0D(AB)=S(A)-S(B), selon la fonction de r\u00e9partition d\u2019une loi de probabilit\u00e9 continue et sym\u00e9trique. A l\u2019origine, Arpad Elo avait propos\u00e9 une loi normale, mais elle fut remplac\u00e9e par la loi logistique P(AB)=1\/[1+10**(-D(AB)\/s)] o\u00f9 s est un facteur d\u2019\u00e9chelle fix\u00e9 au d\u00e9part \u00e0 400 pour le jeu d\u2019\u00e9checs. Plus l\u2019\u00e9cart D(AB) entre A et B est \u00e9lev\u00e9, plus grande est la probabilit\u00e9 de victoire de A. Si la diff\u00e9rence est nulle, les deux \u00e9quipes ont la m\u00eame chance 0.5 de victoire. La mise \u00e0 jour des indices des \u00e9quipes peut se faire \u00e0 l\u2019issue de chaque rencontre. La variation d\u2019indice S d\u2019une \u00e9quipe D(S)=K(X-P) est proportionnelle \u00e0 l\u2019\u00e9cart entre le r\u00e9sultat observ\u00e9 avec X=1, 0.5 et 0 pour une victoire, un nul et une d\u00e9faite, et la probabilit\u00e9 de victoire P de cette \u00e9quipe. On abandonne donc le syst\u00e8me d\u2019attribution d\u2019un nombre de points constant relatif \u00e0 chaque \u00e9ventualit\u00e9 de r\u00e9sultat comme 3 points pour une victoire, 1 point pour un match nul et 0 pour une d\u00e9faite, pour passer \u00e0 un syst\u00e8me o\u00f9 l\u2019on gagne d\u2019autant plus de points qu\u2019on bat une \u00e9quipe mieux class\u00e9e que soi. Et l\u2019on en perdra si l\u2019on est battu par une \u00e9quipe moins bien class\u00e9e comme ce fut le cas pour le match amical qui a r\u00e9cemment oppos\u00e9 la France, \u00e9quipe A d\u2019indice 1990, \u00e0 l\u2019Espagne, \u00e9quipe B d\u2019indice 1966, le 28 mars 2017 au stade de France et qui a vu la d\u00e9faite de la France 0-2. Comme la France \u00e9tait favorite, avec une probabilit\u00e9 de victoire de 0.67, la France a perdu 20 points et, \u00e0 l\u2019oppos\u00e9, l\u2019Espagne en a gagn\u00e9 20. Pour les sp\u00e9cialistes, il s\u2019agit en fait d\u2019un algorithme d\u2019estimation lin\u00e9aris\u00e9e du mod\u00e8le de Bradley-Terry d\u00e9velopp\u00e9 pour les comparaisons deux \u00e0 deux. C\u2019est la version pr\u00e9sent\u00e9e sur le site EloRatings.net. D\u2019autres versions existent en particulier une version dite Elo WWR FIFA, mais qui n\u2019est appliqu\u00e9e par la FIFA qu\u2019au football f\u00e9minin. On se demande pourquoi\u00a0! La m\u00e9thode ELO a fait l\u2019objet de divers d\u00e9veloppements ult\u00e9rieurs mais dans le cadre d\u2019applications hors football\u00a0principalement pour le jeu d\u2019\u00e9checs, et aussi pour le jeu de Go ou la console de jeu Xbox de Microsoft: Classement Glicko de Mark Glickman en 1999 ; True Skill Through Time, dit TTT, de Pierre Dangauthier et alii, en 2007\u00a0; Whole History Rating de R\u00e9mi Coulom en2008 et Elo++ du vainqueur Sismanis d\u2019une comp\u00e9tition Kaggle en 2010. Les versions Glicko, TTT et WHR int\u00e8grent explicitement une composante dynamique pour prendre en compte l\u2019\u00e9volution temporelle de la force des \u00e9quipes. Il est \u00e0 noter \u00e9galement que Glicko, WHR et TTT se r\u00e9f\u00e8rent \u00e0 une inf\u00e9rence bay\u00e9sienne qui combine l\u2019information propre aux donn\u00e9es observ\u00e9es et une information a priori sur les param\u00e8tres qui gouvernent la distribution des observations.<\/p>\n<p>Quoiqu\u2019il en soit, le classement FIFA pour les \u00e9quipes masculines, m\u00eame retouch\u00e9, ne refl\u00e8te pas correctement les valeurs des \u00e9quipes comme l\u2019a montr\u00e9 l\u2019\u00e9tude de Lasek et alii de 2013. Leur analyse porte sur 979 matches jou\u00e9s entre avril 2011 et avril 2012, et son pouvoir pr\u00e9dictif s\u2019av\u00e8re nettement inf\u00e9rieur \u00e0 celui des m\u00e9thodes EloRating.net et Elo WWR. Il n\u2019emp\u00eache que les mod\u00e8les purement statiques ne valent que pour terme et que la dynamique temporelle est au c\u0153ur des pr\u00e9occupations actuelles des concepteurs de classement, comme le montrent Ikonicoff pour les \u00e9checs en 2008 et Catelan et alii en 2010.<\/p>\n<p><span style=\"color: #0000ff;\"><strong>PT\u00a0: <em>Vous avez vous-m\u00eame d\u00e9velopp\u00e9 une approche bay\u00e9sienne d\u2019\u00e9valuation des \u00e9quipes. En quoi se distingue-t-elle des autres ?<\/em><\/strong><\/span><\/p>\n<p><span style=\"color: #993300;\"><strong>JLF<\/strong><\/span>\u00a0: Elle reprend le mod\u00e8le de lien entre la diff\u00e9rence des valeurs d\u2019\u00e9quipes et la probabilit\u00e9 de victoire de l\u2019une d\u2019entre elles, mais en utilisant la loi normale et en int\u00e9grant explicitement la classe des matches nuls, selon le mod\u00e8le Probit \u00e0 seuils de Glenn et David.<\/p>\n<p>L\u2019id\u00e9e est de synth\u00e9tiser l\u2019information sur les performances pass\u00e9es des \u00e9quipes et leur variabilit\u00e9 par des distributions a priori calibr\u00e9es sur des \u00e9valuations ext\u00e9rieures. On suppose que la valeur d\u2019une \u00e9quipe est distribu\u00e9e normalement avec une esp\u00e9rance qui s\u2019exprime comme la r\u00e9gression sur une \u00e9valuation externe de l\u2019\u00e9quipe provenant d\u2019un classement fiable, comme l\u2019UEFA des clubs ou EloRatings.net. Les <em>a priori<\/em> sur ces param\u00e8tres sont mis \u00e0 jour au d\u00e9but de chaque saison \u00e0 partir des <em>a posteriori<\/em> obtenus en fin de saison pr\u00e9c\u00e9dente. On peut \u00e9galement introduire d\u2019autres sources d\u2019information comme les cotes des bookmakers ou m\u00eame des dires d\u2019experts. On peut \u00e9galement rechercher d\u2019un point de vue th\u00e9orique d\u2019autres types de distributions de la force des \u00e9quipes comme le font Chetrite et alii (2017) qui laissent place \u00e0 des \u00e9quipes moins fortes et \u00e0 des surprises comme ce fut la cas avec Leicester dans le la championnat anglais de Premi\u00e8re Ligue en 2015-2016. On obtient des pr\u00e9visions qui ont une pr\u00e9cision tout \u00e0 fait correcte en regard de celles des autres m\u00e9thodes\u00a0: un peu moins de 50% pour la ligue des champions et 40% pour la derni\u00e8re coupe du monde. Ce chiffre est identique \u00e0 celui obtenu par Groll et ses co-auteurs en 2015 avec un mod\u00e8le \u00ab\u00a0score\u00a0\u00bb de type Poisson log-lin\u00e9aire incluant de nombreuses covariables explicatives et des composantes \u00ab\u00a0attaque\u00a0\u00bb et \u00ab\u00a0d\u00e9fense\u00a0\u00bb propres \u00e0 chaque \u00e9quipe. Ce mod\u00e8le \u00ab\u00a0attaque-d\u00e9fense\u00a0\u00bb g\u00e9n\u00e9ralise au domaine non lin\u00e9aire la m\u00e9thode des moindres carr\u00e9s appliqu\u00e9e au mod\u00e8le lin\u00e9aire \u00ab\u00a0score\u00a0\u00bb de Kenneth Massey de 1997. Des mod\u00e8les encore plus sophistiqu\u00e9s\u00a0 bas\u00e9s sur une distribution de Skellam avec inflation en z\u00e9ro ont \u00e9t\u00e9 propos\u00e9s pour prendre en compte la sous-estimation chronique des matches nuls en football, montr\u00e9e par Karlis et Ntzoufras en 2006. Un panorama assez complet des m\u00e9thodes math\u00e9matiques relevant du secteur \u00ab\u00a0Evaluation et Classement\u00a0\u00bb dans le sport est fourni par l\u2019ouvrage de Langville et Meyer de 2012 et un \u00e9tat des lieux tr\u00e8s d\u00e9taill\u00e9 pour l\u2019ensemble des disciplines sportives figure dans l\u2019article de synth\u00e8se de Stefani publi\u00e9 en 2011. Les th\u00e9oriciens<\/p>\n<p><span style=\"color: #0000ff;\"><strong>PT\u00a0: <em>Vous venez d\u2019\u00e9voquer des mod\u00e9lisations de plus en plus sophistiqu\u00e9es. N\u2019y a-t-il pas l\u00e0 un risque pris par le th\u00e9oricien de se faire avant tout plaisir au d\u00e9triment de l\u2019efficacit\u00e9 et de la compr\u00e9hension\u00a0?<\/em> <\/strong><\/span><\/p>\n<p><span style=\"color: #993300;\"><strong>JLF<\/strong><\/span>\u00a0: Vous avez tout \u00e0 fait raison sur ce point. La simplicit\u00e9 conceptuelle des mod\u00e8les doit rester une priorit\u00e9 m\u00eame si les algorithmes d\u2019estimation de ceux-ci font appel \u00e0 des m\u00e9thodes num\u00e9riques lourdes. C\u2019est ce qui s\u2019est pass\u00e9 avec l\u2019irruption des algorithmes de simulation de Monte &#8211; Carlo par cha\u00eenes de Markov cach\u00e9es, les MCMC, qui a, d\u2019un seul coup, lib\u00e9r\u00e9 toutes les potentialit\u00e9s de la statistique bay\u00e9sienne. Il en est de m\u00eame de l\u2019analyse de r\u00e9seaux par les mod\u00e8les graphiques qui s\u00e9duisent \u00e0 juste titre les d\u00e9cideurs et les utilisateurs par leur simplicit\u00e9. Le succ\u00e8s de l\u2019algorithme Google PageRank de classification des sites internet en est une illustration manifeste. Cet algorithme a trouv\u00e9 d\u2019ailleurs des applications dans d\u2019autres domaines, par exemple en bibliom\u00e9trie, auquel je m\u2019int\u00e9resse avec Gilles Celeux et Julie Josse. J\u2019aurais pu d\u2019ailleurs aussi vous parler de son utilisation dans les classements sportifs et de jeux. Mais en sport et en football plus qu\u2019ailleurs, la confrontation permanente des pr\u00e9dictions issues des mod\u00e8les avec les r\u00e9sultats effectifs des matches constitue un juge de paix implacable qui incline le statisticien \u00e0 la plus grande humilit\u00e9.<\/p>\n<hr \/>\n<p><em><strong>Quelques \u00e9l\u00e9ments bibliographiques<\/strong><\/em><\/p>\n<p>&nbsp;<\/p>\n<p><em><strong>Ouvrages<\/strong><\/em><\/p>\n<p><em>Albert J., Koning R. H., (2008), Statistical Thinking in Sports. Chapman &amp; Hall\/RC.<\/em><\/p>\n<p><em>Elo A. E., (1978), The Rating of Chess Players-Past and Present, Battsford. chess books, HarperCollins.<\/em><\/p>\n<p><em>Hyeans A., (2016), Sport Data Revolution, \u00a0L\u2019analyse des donn\u00e9es au service de la performance sportive, Dunod.<\/em><\/p>\n<p><em>Langville A. N., Meyer C. D., (2012), Who\u2019s #1 ? The Science of Rating and Ranking, Princeton University Press.<\/em><\/p>\n<p>&nbsp;<\/p>\n<p><em><strong>Articles de vulgarisation et de synth\u00e8se<\/strong><\/em><\/p>\n<p><em>Aftalion A., Lehning H., Lavallou F., \u00a0(2016), Math\u00e9matiques et sports. Tangente, 168, 23-37<\/em><\/p>\n<p><em>Coulom R., (2010), \u00a0<span style=\"color: #0000ff;\"><a style=\"color: #0000ff;\" href=\"http:\/\/www.pourlascience.fr\/ewb_pages\/a\/article-jeux-et-sports-le-probleme-des-classements-25339.php\">Jeux et sports : le probl\u00e8me des classements<\/a><\/span>.\u00a0Pour la Science, 393, 20-27.<\/em><\/p>\n<p><em>Ikonicoff R., (2008), Echecs: les maths veulent d\u00e9signer le vrai champion du monde. Science &amp; Vie, 1090, 110-117.<\/em><\/p>\n<p><em>Stefani R., (2011), The methodology of officially recognized International Sports Rating Systems, Journal of Quantitative Analysis in Sports, 7, 1-22.<\/em><\/p>\n<p>&nbsp;<\/p>\n<p><em><strong>Articles de Recherche<\/strong><\/em><\/p>\n<p><em>Cattelan M., Varin C., Firth D., (2012), Stochastic dynamic Thurstone-Mosteller models for sports tournaments, Applied Statistics, 61, 135-150.<\/em><\/p>\n<p><em>Chetrite R., Diel R., Lerasle L., (2017) The Number of Potential Winners in Bradley-Terry Model in Random Environment. Annals of Applied Probability, \u00e0 para\u00eetre<\/em><\/p>\n<p><em>Coulom R., (2008), Whole-history rating: a Bayesian rating system for players of time varying strength, Conference on Computers and Games, Beijing, China.<\/em><\/p>\n<p><em>Dangauthier P., Herbrich R., Minka T., Graepel T., (2007), True Skill through time\u00a0: revisiting the history of chess, Advances in Neural Information Processing Systems, 20, 337-344.<\/em><\/p>\n<p><em>Glenn W. A., David H. A., (1960), Ties in paired-comparison experiments using a modified Thurstone-Mosteller model, Biometrics, 16: 86-109.<\/em><\/p>\n<p><em>Glickman, M. E. (1999), Parameter estimation in large dynamic paired comparison experiments, Applied Statistics, 48, 377\u2013394.<\/em><\/p>\n<p><em>Groll A., Schauberger G., Tutz G., (2015), Prediction of major international soccer tournaments based on team specific regularized Poisson regression: an application to FIFA World Cup 2014, Journal of Quantitative Analysis in Sports, 11, 97-115.<\/em><\/p>\n<p><em>Guyon J., (2014), Rethinking the FIFA world cup final draw, Journal of Quantitative Analysis in Sports, 11, 169-182.<\/em><\/p>\n<p><em>Karlis D., Ntzoufras I., (2009), Bayesian modeling of football outcomes using the Skellam distribution for the goal difference, IMA Journal of management Mathematics, 20, 133-145<\/em><\/p>\n<p><em>Lasek J., Szlavik Z., Bhulai S., (2013), The predictive power of ranking systems in association football, International Journal of Applied Pattern Recognition, 1. 27-46<\/em><\/p>\n<p><em>Massey K., (1997), Statistical Models Applied to the Rating of Sport Teams, MSc thesis, Bluefield College.<\/em><\/p>\n<p><em>SFdS, (2015), Num\u00e9ro Sp\u00e9cial \u201cSports et Statistique\u201d, Journal de la Soci\u00e9t\u00e9 Fran\u00e7aise de Statistique, 156, 1-58.<\/em><\/p>\n<p><em>Sismanis Y., (2010), How I won the \u201cChess Ratings: Elo vs the rest of the world\u201d <span style=\"color: #0000ff;\"><a style=\"color: #0000ff;\" href=\"http:\/\/blog.kaggle.com\/wp-content\/uploads\/2011\/02\/kaggle_win.pdf\">blog.kaggle.com\/wpcontent\/uploads\/2011\/02\/kaggle_win.pdf<\/a><\/span><\/em><\/p>\n<p>&nbsp;<\/p>\n","protected":false},"excerpt":{"rendered":"<p>\u00a0Entretien avec Philippe Tassi, avril 2017 Philippe Tassi\u00a0: Jean-Louis, vous avez une carri\u00e8re brillante de chercheur \u00e0 l\u2019INRA, et depuis 5 ans vous \u00eates \u00e0 l\u2019IMAG de Montpellier. En janvier 2014, vous avez pr\u00e9sent\u00e9 une communication passionnante sur une approche bay\u00e9sienne de la pr\u00e9vision et du classement en football lors du premier colloque organis\u00e9 sur [&hellip;]<\/p>\n","protected":false},"author":72,"featured_media":2246,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_et_pb_use_builder":"","_et_pb_old_content":"","_et_gb_content_width":"","_exactmetrics_skip_tracking":false,"_exactmetrics_sitenote_active":false,"_exactmetrics_sitenote_note":"","_exactmetrics_sitenote_category":0,"footnotes":""},"categories":[137,133],"tags":[],"class_list":["post-2244","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-sport","category-themes","et-has-post-format-content","et_post_format-et-post-format-standard"],"_links":{"self":[{"href":"https:\/\/variances.eu\/index.php?rest_route=\/wp\/v2\/posts\/2244","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/variances.eu\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/variances.eu\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/variances.eu\/index.php?rest_route=\/wp\/v2\/users\/72"}],"replies":[{"embeddable":true,"href":"https:\/\/variances.eu\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=2244"}],"version-history":[{"count":0,"href":"https:\/\/variances.eu\/index.php?rest_route=\/wp\/v2\/posts\/2244\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/variances.eu\/index.php?rest_route=\/wp\/v2\/media\/2246"}],"wp:attachment":[{"href":"https:\/\/variances.eu\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=2244"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/variances.eu\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=2244"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/variances.eu\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=2244"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}