{"id":2476,"date":"2017-09-13T11:17:34","date_gmt":"2017-09-13T09:17:34","guid":{"rendered":"http:\/\/variances.eu\/?p=2476"},"modified":"2017-09-13T11:26:29","modified_gmt":"2017-09-13T09:26:29","slug":"estimation-de-cotes-football","status":"publish","type":"post","link":"https:\/\/variances.eu\/?p=2476","title":{"rendered":"Estimation de cotes au football"},"content":{"rendered":"<p><em><strong>Introduction<\/strong><\/em><\/p>\n<p><em>Cet article est issu d\u2019un projet de statistiques appliqu\u00e9es consacr\u00e9 au calcul des estimations de scores au football\u00a0: estimation de la probabilit\u00e9 d&rsquo;une victoire, d&rsquo;un match nul, ou d&rsquo;une d\u00e9faite lors d&rsquo;un match. Le projet a \u00e9t\u00e9 encadr\u00e9 par Alexander Buchholz et Vincent Cottet.<\/em><\/p>\n<hr \/>\n<p>Compte tenu du d\u00e9veloppement du march\u00e9 des jeux et des pronostics, divers travaux ont \u00e9t\u00e9 effectu\u00e9s \u00e0 ce sujet au cours des derni\u00e8res ann\u00e9es. On pourra lire par exemple l\u2019interview de Jean-Louis Foulley, dans Variances (mai 2017). Deux publications ont particuli\u00e8rement attir\u00e9 notre attention, notamment car elles utilisent deux mod\u00e8les proches mais utilisent deux approches diff\u00e9rentes\u00a0; il s\u2019agit :<\/p>\n<ul>\n<li>des travaux de Dixon et Coles, qui optent pour une approche fr\u00e9quentiste (Mark J. Dixon, Stuart G. Coles, Modelling Association Football Scores and Inefficiencies in the Football Betting Market, <em>Journal of the Royal Statistical Society\u00a0: Series C (Applied Statistics)<\/em>, 46(2), 1997<\/li>\n<li>des travaux de Baio et Blangiardo qui utilisent plut\u00f4t une approche bay\u00e9sienne (Gianluca Baio, Marta Blangiardo, Bayesian Hierarchical Model for the Prediction of Football Results, <em>Journal of Applied Statistics<\/em>, 37(2), 2010.<\/li>\n<\/ul>\n<p>L&rsquo;objectif du projet est de comparer les r\u00e9sultats obtenus par ces deux approches \u00e0 partir d&rsquo;un m\u00eame mod\u00e8le et sur les m\u00eames donn\u00e9es, et donc pouvoir estimer les cotes lors d&rsquo;un match de football.<\/p>\n<h3><strong>1. Pr\u00e9sentation des donn\u00e9es<\/strong><\/h3>\n<p>Nous nous int\u00e9ressons aux r\u00e9sultats de la saison 2015-2016 de la Ligue 1 de la Ligue Nationale de Football (auparavant appel\u00e9 championnat de premi\u00e8re division fran\u00e7aise de football).<\/p>\n<p>Nous nous concentrons uniquement sur les scores finaux de chaque match.<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter wp-image-2479\" src=\"http:\/\/variances.eu\/wp-content\/uploads\/2017\/09\/Image2.png\" alt=\"\" width=\"800\" height=\"277\" srcset=\"https:\/\/variances.eu\/wp-content\/uploads\/2017\/09\/Image2.png 978w, https:\/\/variances.eu\/wp-content\/uploads\/2017\/09\/Image2-300x104.png 300w, https:\/\/variances.eu\/wp-content\/uploads\/2017\/09\/Image2-600x208.png 600w\" sizes=\"(max-width: 800px) 100vw, 800px\" \/><\/p>\n<p>Chaque ligne du tableau de donn\u00e9es correspond \u00e0 un match. Le championnat de Ligue 1 \u00e9tant constitu\u00e9 de 20 \u00e9quipes, chaque couple d\u2019\u00e9quipes se rencontrant deux fois (une fois \u00e0 domicile et une fois \u00e0 l&rsquo;ext\u00e9rieur), le tableau est constitu\u00e9 de 380 lignes.<\/p>\n<p>Chacune des \u00e9quipes est indic\u00e9e (<img decoding=\"async\" class=\"mathtex-equation-editor\" src=\"http:\/\/chart.apis.google.com\/chart?cht=tx&amp;chl=_%7B%7D%5E%7Bi%7Dhome\" alt=\"_{}^{i}home\" align=\"absmiddle\" \/>\u00a0et <img decoding=\"async\" class=\"mathtex-equation-editor\" src=\"http:\/\/chart.apis.google.com\/chart?cht=tx&amp;chl=_%7B%7D%5E%7Bi%7Daway\" alt=\"_{}^{i}away\" align=\"absmiddle\" \/>\u00a0), et la colonne \u201cJourn\u00e9e\u201d correspond au num\u00e9ro de la journ\u00e9e o\u00f9 a eu lieu ce match.<\/p>\n<p>Par exemple, la premi\u00e8re ligne correspond au match Lille \u2013 Paris SG, match de la premi\u00e8re journ\u00e9e se jouant \u00e0 Lille, match gagn\u00e9 par le PSG sur le score de 1 \u00e0 0.<\/p>\n<h3><strong>2. Le mod\u00e8le utilis\u00e9<\/strong><\/h3>\n<p>Nous allons d\u00e9crire notre mod\u00e8le.<\/p>\n<p>Soient un match opposant deux \u00e9quipes i et j, i jouant \u00e0 domicile et j \u00e0 l&rsquo;ext\u00e9rieur. Tout comme les deux articles cit\u00e9s en r\u00e9f\u00e9rence, nous faisons plusieurs hypoth\u00e8ses majeures :<\/p>\n<ul>\n<li>A chaque match, le nombre de buts marqu\u00e9s par l&rsquo;\u00e9quipe \u00e0 domicile, not\u00e9 <img decoding=\"async\" class=\"mathtex-equation-editor\" src=\"http:\/\/chart.apis.google.com\/chart?cht=tx&amp;chl=x_%7B%7Bi%2C%20j%7D%7D\" alt=\"x_{{i, j}}\" align=\"absmiddle\" \/>\u00a0et ceux marqu\u00e9s par l&rsquo;\u00e9quipe \u00e0 l&rsquo;ext\u00e9rieur, not\u00e9 <img decoding=\"async\" class=\"mathtex-equation-editor\" src=\"http:\/\/chart.apis.google.com\/chart?cht=tx&amp;chl=y_%7B%7Bi%2C%20j%7D%7D\" alt=\"y_{{i, j}}\" align=\"absmiddle\" \/>, sont ind\u00e9pendants.<\/li>\n<li>Chaque \u00e9quipe i poss\u00e8de un param\u00e8tre d&rsquo;attaque not\u00e9 <img decoding=\"async\" class=\"mathtex-equation-editor\" src=\"http:\/\/chart.apis.google.com\/chart?cht=tx&amp;chl=%5Calpha_%7B%7Bi%7D%7D%0A\" alt=\"\\alpha_{{i}} \" align=\"absmiddle\" \/>\u00a0et un param\u00e8tre de d\u00e9fense not\u00e9 <img decoding=\"async\" class=\"mathtex-equation-editor\" src=\"http:\/\/chart.apis.google.com\/chart?cht=tx&amp;chl=%5Cbeta_%7B%7Bi%7D%7D%0A\" alt=\"\\beta_{{i}} \" align=\"absmiddle\" \/>. Plus le param\u00e8tre\u00a0<img decoding=\"async\" class=\"mathtex-equation-editor\" src=\"http:\/\/chart.apis.google.com\/chart?cht=tx&amp;chl=%5Calpha_%7B%7Bi%7D%7D%0A\" alt=\"\\alpha_{{i}} \" align=\"absmiddle\" \/>\u00a0est \u00e9lev\u00e9, plus l&rsquo;\u00e9quipe a de chances de marquer un but. Tandis que plus le param\u00e8tre de d\u00e9fense <img decoding=\"async\" class=\"mathtex-equation-editor\" src=\"http:\/\/chart.apis.google.com\/chart?cht=tx&amp;chl=%5Cbeta_%7B%7Bi%7D%7D\" alt=\"\\beta_{{i}}\" align=\"absmiddle\" \/>\u00a0est \u00e9lev\u00e9, plus l&rsquo;\u00e9quipe encaisse de buts.<\/li>\n<li>Un autre param\u00e8tre A d\u00e9crit l&rsquo;avantage d&rsquo;une \u00e9quipe \u00e0 jouer devant son public (cf point suivant).<\/li>\n<li>La distribution des buts suit une loi de Poisson :<\/li>\n<\/ul>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter wp-image-2482\" src=\"http:\/\/variances.eu\/wp-content\/uploads\/2017\/09\/Image3-2-300x41.png\" alt=\"\" width=\"176\" height=\"24\" srcset=\"https:\/\/variances.eu\/wp-content\/uploads\/2017\/09\/Image3-2-300x41.png 300w, https:\/\/variances.eu\/wp-content\/uploads\/2017\/09\/Image3-2.png 390w\" sizes=\"(max-width: 176px) 100vw, 176px\" \/><\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter wp-image-2483\" src=\"http:\/\/variances.eu\/wp-content\/uploads\/2017\/09\/Image4-300x43.png\" alt=\"\" width=\"167\" height=\"24\" srcset=\"https:\/\/variances.eu\/wp-content\/uploads\/2017\/09\/Image4-300x43.png 300w, https:\/\/variances.eu\/wp-content\/uploads\/2017\/09\/Image4.png 365w\" sizes=\"(max-width: 167px) 100vw, 167px\" \/><\/p>\n<p>o\u00f9<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\" wp-image-2484 alignleft\" src=\"http:\/\/variances.eu\/wp-content\/uploads\/2017\/09\/Image5-300x22.png\" alt=\"\" width=\"300\" height=\"22\" srcset=\"https:\/\/variances.eu\/wp-content\/uploads\/2017\/09\/Image5-300x22.png 300w, https:\/\/variances.eu\/wp-content\/uploads\/2017\/09\/Image5.png 554w\" sizes=\"(max-width: 300px) 100vw, 300px\" \/><\/p>\n<p>&nbsp;<\/p>\n<p>Afin de rendre le mod\u00e8le identifiable, nous y ajoutons la contrainte suivante :<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter wp-image-2485\" src=\"http:\/\/variances.eu\/wp-content\/uploads\/2017\/09\/Image6.png\" alt=\"\" width=\"143\" height=\"53\" \/><\/p>\n<p>o\u00f9 n est le nombre d&rsquo;\u00e9quipes de la ligue (n = 20).<\/p>\n<h3><strong>3. L\u2019approche fr\u00e9quentiste<\/strong><\/h3>\n<p>L\u2019approche fr\u00e9quentiste est celle adopt\u00e9e par Dixon et Coles dans leurs travaux. Elle consiste \u00e0 calculer la log-vraisemblance du mod\u00e8le, et de calculer les estimateurs de fa\u00e7on \u00e0 la maximiser :<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter size-medium wp-image-2488\" src=\"http:\/\/variances.eu\/wp-content\/uploads\/2017\/09\/Image7-300x30.png\" alt=\"\" width=\"300\" height=\"30\" srcset=\"https:\/\/variances.eu\/wp-content\/uploads\/2017\/09\/Image7-300x30.png 300w, https:\/\/variances.eu\/wp-content\/uploads\/2017\/09\/Image7-600x59.png 600w, https:\/\/variances.eu\/wp-content\/uploads\/2017\/09\/Image7.png 788w\" sizes=\"(max-width: 300px) 100vw, 300px\" \/><\/p>\n<p>avec :<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"size-medium wp-image-2489 aligncenter\" src=\"http:\/\/variances.eu\/wp-content\/uploads\/2017\/09\/Image8-300x20.png\" alt=\"\" width=\"300\" height=\"20\" srcset=\"https:\/\/variances.eu\/wp-content\/uploads\/2017\/09\/Image8-300x20.png 300w, https:\/\/variances.eu\/wp-content\/uploads\/2017\/09\/Image8-600x39.png 600w, https:\/\/variances.eu\/wp-content\/uploads\/2017\/09\/Image8.png 784w\" sizes=\"(max-width: 300px) 100vw, 300px\" \/><\/p>\n<p>Ainsi nous obtenons des estimateurs des param\u00e8tres <img decoding=\"async\" class=\"mathtex-equation-editor\" src=\"http:\/\/chart.apis.google.com\/chart?cht=tx&amp;chl=%5Calpha_%7B%7Bi%7D%7D\" alt=\"\\alpha_{{i}}\" align=\"absmiddle\" \/>\u00a0et <img decoding=\"async\" class=\"mathtex-equation-editor\" src=\"http:\/\/chart.apis.google.com\/chart?cht=tx&amp;chl=%5Cbeta_%7B%7Bi%7D%7D\" alt=\"\\beta_{{i}}\" align=\"absmiddle\" \/>\u00a0pour chacune des \u00e9quipes, et du param\u00e8tre <em>A<\/em>.<\/p>\n<p>Nous calculons \u00e9galement l\u2019information de Fisher qui permet de faire une approximation des \u00e9carts-types des estimateurs des param\u00e8tres. Nous avons \u00e9galement fait le calcul des probabilit\u00e9s du score de chaque match par cette approche, qui permet d\u2019obtenir les probabilit\u00e9s de victoire\/nul\/d\u00e9faite. Il s\u2019en suit la possibilit\u00e9 d\u2019\u00e9tablir des cotes que nous pouvons par la suite comparer \u00e0 celles \u00e9tablies par les bookmakers.<\/p>\n<h3><strong>4. L\u2019approche bay\u00e9sienne<\/strong><\/h3>\n<p>L\u2019approche bay\u00e9sienne, quant \u00e0 elle, est utilis\u00e9 par Biao et Blangiardo dans leur article. Comme le nombre de donn\u00e9es utilis\u00e9es est somme toute assez faible, l\u2019approche bay\u00e9sienne pr\u00e9sente l\u2019avantage d\u2019avoir des \u00e9carts-types plus faibles que l\u2019approche fr\u00e9quentiste.<\/p>\n<p>Nous nous basons sur des m\u00e9thodes de Monte Carlo afin d\u2019obtenir les estimations des param\u00e8tres. Les lois <em>a priori<\/em> des \u03b1<sub>i<\/sub> et \u03b2<sub>i<\/sub> et \u00a0sont des lois log-normales, et les moyenne et les \u00e9carts-types de ces lois <em>a priori<\/em>\u00a0des <img decoding=\"async\" class=\"mathtex-equation-editor\" src=\"http:\/\/chart.apis.google.com\/chart?cht=tx&amp;chl=%5Calpha_%7B%7Bi%7D%7D\" alt=\"\\alpha_{{i}}\" align=\"absmiddle\" \/>\u00a0et <img decoding=\"async\" class=\"mathtex-equation-editor\" src=\"http:\/\/chart.apis.google.com\/chart?cht=tx&amp;chl=%5Cbeta_%7B%7Bi%7D%7D\" alt=\"\\beta_{{i}}\" align=\"absmiddle\" \/>\u00a0et <em>A<\/em> suivent respectivement des lois normale et gamma. Nous faisons ainsi une estimation de la loi <em>a posteriori<\/em> qui n\u00e9cessite, compte tenu de la difficult\u00e9 \u00e0 la calculer, une estimation par l\u2019algorithme de Metropolis-Hastings.<\/p>\n<p>De m\u00eame, nous calculons \u00e9galement les probabilit\u00e9s de r\u00e9sultat de chaque match.<\/p>\n<h3><strong>5. R\u00e9sultats<\/strong><\/h3>\n<p>Les estimations des diff\u00e9rents param\u00e8tres d\u2019attaque et de d\u00e9fense pour chaque \u00e9quipe conduisent \u00e0 des r\u00e9sultats tr\u00e8s similaires entre les deux approches.<\/p>\n<p>Une diff\u00e9rence appara\u00eet au niveau des \u00e9carts-types, beaucoup moins \u00e9lev\u00e9s pour l\u2019approche bay\u00e9sienne.<\/p>\n<p>Pour la param\u00e8tre <em>A<\/em> :<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter wp-image-2490\" src=\"http:\/\/variances.eu\/wp-content\/uploads\/2017\/09\/Image9.png\" alt=\"\" width=\"800\" height=\"141\" srcset=\"https:\/\/variances.eu\/wp-content\/uploads\/2017\/09\/Image9.png 945w, https:\/\/variances.eu\/wp-content\/uploads\/2017\/09\/Image9-300x53.png 300w, https:\/\/variances.eu\/wp-content\/uploads\/2017\/09\/Image9-600x105.png 600w\" sizes=\"(max-width: 800px) 100vw, 800px\" \/><\/p>\n<p>Pour les param\u00e8tres <img decoding=\"async\" class=\"mathtex-equation-editor\" src=\"http:\/\/chart.apis.google.com\/chart?cht=tx&amp;chl=%5Calpha_%7B%7Bi%7D%7D\" alt=\"\\alpha_{{i}}\" align=\"absmiddle\" \/>\u00a0et <img decoding=\"async\" class=\"mathtex-equation-editor\" src=\"http:\/\/chart.apis.google.com\/chart?cht=tx&amp;chl=%5Cbeta_%7B%7Bi%7D%7D\" alt=\"\\beta_{{i}}\" align=\"absmiddle\" \/>\u00a0:<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter wp-image-2493\" src=\"http:\/\/variances.eu\/wp-content\/uploads\/2017\/09\/Image11.png\" alt=\"\" width=\"800\" height=\"1004\" srcset=\"https:\/\/variances.eu\/wp-content\/uploads\/2017\/09\/Image11.png 836w, https:\/\/variances.eu\/wp-content\/uploads\/2017\/09\/Image11-239x300.png 239w, https:\/\/variances.eu\/wp-content\/uploads\/2017\/09\/Image11-816x1024.png 816w, https:\/\/variances.eu\/wp-content\/uploads\/2017\/09\/Image11-600x753.png 600w\" sizes=\"(max-width: 800px) 100vw, 800px\" \/><\/p>\n<p>Nous observons ainsi que les estimations sont tr\u00e8s proches selon les deux approches. La diff\u00e9rence majeure porte sur les \u00e9cart-types, avec une approche bay\u00e9sienne plus pr\u00e9cise. Nous pouvons notamment observer que le PSG, qui a largement domin\u00e9 la Ligue 1 lors de la saison 2015-2016, a le param\u00e8tre <img decoding=\"async\" class=\"mathtex-equation-editor\" src=\"http:\/\/chart.apis.google.com\/chart?cht=tx&amp;chl=%5Calpha_%7B%7Bi%7D%7D\" alt=\"\\alpha_{{i}}\" align=\"absmiddle\" \/>\u00a0le plus \u00e9lev\u00e9 et le param\u00e8tre <img decoding=\"async\" class=\"mathtex-equation-editor\" src=\"http:\/\/chart.apis.google.com\/chart?cht=tx&amp;chl=%5Cbeta_%7B%7Bi%7D%7D\" alt=\"\\beta_{{i}}\" align=\"absmiddle\" \/>\u00a0le plus faible. C\u2019est l\u2019inverse pour Troyes qui a termin\u00e9 dernier.<\/p>\n<p>Nous avons \u00e9galement pu calculer les probabilit\u00e9s de score selon les deux approches. En voici un exemple pour le match Angers \u2013 Toulouse :<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter wp-image-2494\" src=\"http:\/\/variances.eu\/wp-content\/uploads\/2017\/09\/Image12.png\" alt=\"\" width=\"800\" height=\"170\" srcset=\"https:\/\/variances.eu\/wp-content\/uploads\/2017\/09\/Image12.png 945w, https:\/\/variances.eu\/wp-content\/uploads\/2017\/09\/Image12-300x64.png 300w, https:\/\/variances.eu\/wp-content\/uploads\/2017\/09\/Image12-600x128.png 600w\" sizes=\"(max-width: 800px) 100vw, 800px\" \/><\/p>\n<p>Il est donc possible de calculer les cotes pour chaque match, \u00e0 travers les deux approches les plus utilis\u00e9es, qui conduisent \u00e0 des r\u00e9sultats globalement comparables.<\/p>\n<p>Pour conclure, nous avons \u00e9tudi\u00e9 deux pistes d\u2019approfondissement. La premi\u00e8re a consist\u00e9 \u00e0 \u00e9tudier une strat\u00e9gie de pari sportif sur les matches, bas\u00e9e sur l\u2019esp\u00e9rance de gain. Une seconde est d\u2019entrer dans le d\u00e9tail de la r\u00e9alit\u00e9 d\u2019une saison de championnat de football\u00a0par l\u2019int\u00e9gration de variables exog\u00e8nes : par exemple, quel impact sur les param\u00e8tres du mod\u00e8le peut avoir un changement d\u2019entra\u00eeneur en cours de saison, ce qui est une pratique non rare. Plus g\u00e9n\u00e9ralement, peut-on int\u00e9grer d\u2019autres variables exog\u00e8nes comme les achats ou ventes de joueurs au mercato d\u2019hiver\u00a0?<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Introduction Cet article est issu d\u2019un projet de statistiques appliqu\u00e9es consacr\u00e9 au calcul des estimations de scores au football\u00a0: estimation de la probabilit\u00e9 d&rsquo;une victoire, d&rsquo;un match nul, ou d&rsquo;une d\u00e9faite lors d&rsquo;un match. Le projet a \u00e9t\u00e9 encadr\u00e9 par Alexander Buchholz et Vincent Cottet. Compte tenu du d\u00e9veloppement du march\u00e9 des jeux et des [&hellip;]<\/p>\n","protected":false},"author":87,"featured_media":2496,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_et_pb_use_builder":"","_et_pb_old_content":"","_et_gb_content_width":"","_exactmetrics_skip_tracking":false,"_exactmetrics_sitenote_active":false,"_exactmetrics_sitenote_note":"","_exactmetrics_sitenote_category":0,"footnotes":""},"categories":[138,18],"tags":[],"class_list":["post-2476","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-les-etudiants-sengagent","category-statistiques","et-has-post-format-content","et_post_format-et-post-format-standard"],"_links":{"self":[{"href":"https:\/\/variances.eu\/index.php?rest_route=\/wp\/v2\/posts\/2476","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/variances.eu\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/variances.eu\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/variances.eu\/index.php?rest_route=\/wp\/v2\/users\/87"}],"replies":[{"embeddable":true,"href":"https:\/\/variances.eu\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=2476"}],"version-history":[{"count":0,"href":"https:\/\/variances.eu\/index.php?rest_route=\/wp\/v2\/posts\/2476\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/variances.eu\/index.php?rest_route=\/wp\/v2\/media\/2496"}],"wp:attachment":[{"href":"https:\/\/variances.eu\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=2476"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/variances.eu\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=2476"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/variances.eu\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=2476"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}