{"id":2218,"date":"2017-05-11T17:42:37","date_gmt":"2017-05-11T15:42:37","guid":{"rendered":"http:\/\/variances.eu\/?p=2218"},"modified":"2018-01-03T11:59:34","modified_gmt":"2018-01-03T09:59:34","slug":"barca-bayes-psg-trois-lecons-de-probabilites-de-luis-enrique","status":"publish","type":"post","link":"https:\/\/variances.eu\/?p=2218","title":{"rendered":"Bar\u00e7a, Bayes, PSG : les trois le\u00e7ons de probabilit\u00e9s de Luis Enrique"},"content":{"rendered":"<p><span style=\"color: #3366ff;\"><em>Publi\u00e9 sur le compte Linkedin de l\u2019auteur le 13 mars 2017 &#8211; Avec l\u2019aimable autorisation de l\u2019auteur<\/em><\/span><\/p>\n<p><em>Luis Enrique, le coach de Barcelone, n\u2019est pas seulement un grand entra\u00eeneur\u00a0: c\u2019est un expert en statistiques. Et s\u2019il a administr\u00e9 au PSG une le\u00e7on de football, il nous a offert par la m\u00eame occasion trois le\u00e7ons de probabilit\u00e9s.\u00a0(Pour ceux qui ne suivraient pas l\u2019actualit\u00e9 du football, rappelons que, en 8\u00e8mes de finale de la Ligue des Champions, le PSG a \u00e9t\u00e9 battu 6-1 \u00e0 Barcelone le 8 mars apr\u00e8s avoir gagn\u00e9 4-0 \u00e0 Paris le 14 f\u00e9vrier).\u00a0<\/em><\/p>\n<p>De la d\u00e9b\u00e2cle du PSG au Camp Nou, on peut tirer toutes les le\u00e7ons de leadership et de management des hommes. Et la presse ne s\u2019en prive pas. Mais il peut \u00eatre amusant d\u2019y voir aussi un bel exemple de pr\u00e9vision probabiliste. On se souvient que Luis Enrique, l\u2019entra\u00eeneur de Barcelone, a eu, la veille du match, des <span style=\"color: #0000ff;\"><a style=\"color: #0000ff;\" href=\"http:\/\/www.sports.fr\/football\/ligue-des-champions\/articles\/barca-luis-enrique-s-ils-en-ont-marque-4-on-peut-en-mettre-6-1774733\/\">propos<\/a><\/span> pr\u00e9monitoires : \u00ab\u00a0S\u2019ils en ont marqu\u00e9 quatre, on peut en mettre six\u00a0\u00bb. Ce qui passait pour une rodomontade annon\u00e7ait en fait la <em>remontada<\/em>.<\/p>\n<p>Alors, Enrique est-il voyant\u00a0? Sans doute son optimisme est-il communicatif, et contribue-t-il puissamment au triomphe de son \u00e9quipe. Mais il d\u00e9montre\u00a0aussi une parfaite ma\u00eetrise du th\u00e9or\u00e8me de Bayes \u2013 un outil essentiel \u00e0 toute pr\u00e9vision dans un environnement incertain.<\/p>\n<h3><strong>Le\u00e7on 1\u00a0: conna\u00eetre la probabilit\u00e9 <em>a priori<\/em><\/strong><\/h3>\n<p>Pour le comprendre, il faut d\u2019abord r\u00e9aliser que nos estimations de la probabilit\u00e9 d\u2019un \u00e9v\u00e9nement ne d\u00e9pendent pas seulement des faits que nous observons, mais aussi de ce que nous pensons \u00eatre leur probabilit\u00e9 <em>a priori<\/em>. Supposez par exemple que vous observiez un skieur qui descend une piste difficile sans tomber, trois fois de suite. Quelle est, \u00e0 votre avis, la probabilit\u00e9 qu\u2019il y parvienne une quatri\u00e8me fois\u00a0? Elev\u00e9e, sans doute. Mais si vous saviez au d\u00e9part que ce skieur est un moniteur, votre estimation de cette probabilit\u00e9 sera plus \u00e9lev\u00e9e encore. A priori, avant toute observation des trois descentes, vous cr\u00e9ditez le moniteur d\u2019une probabilit\u00e9 de succ\u00e8s plus grande qu\u2019un skieur moyen. Et vous avez bien raison\u00a0: la <em>probabilit\u00e9 a posteriori<\/em> d\u00e9pend de l\u2019observation, mais aussi de la <em>probabilit\u00e9 a priori<\/em>.<\/p>\n<p>Le th\u00e9or\u00e8me de Bayes permet de quantifier cette intuition, en calculant la probabilit\u00e9 a posteriori\u00a0\u00e0 partir de (1) la probabilit\u00e9 a priori, et de deux probabilit\u00e9s distinctes concernant l\u2019observation nouvelle : les probabilit\u00e9s que cette observation se produise si (2) l\u2019hypoth\u00e8se est vraie et (3) l\u2019hypoth\u00e8se est fausse. (La formule est en bas de l\u2019article, pour les amateurs, avec en Annexe 2 les calculs correspondant \u00e0 tous les exemples qui suivent.)<\/p>\n<p>Pour illustrer l\u2019importance de ce calcul, prenons l\u2019exemple d\u2019un test qui d\u00e9piste les utilisateurs d&rsquo;une drogue illicite. Supposons que ce test soit fiable \u00e0 99% dans les deux sens, c\u2019est-\u00e0-dire que 99% des utilisateurs de drogue sont d\u00e9tect\u00e9s et que 99% des verdicts positifs r\u00e9v\u00e8lent effectivement un utilisateur de drogue. En d &lsquo;autres termes, il n\u2019y a que 1% de \u00ab\u00a0faux n\u00e9gatifs\u00a0\u00bb et 1% de \u00ab\u00a0faux positifs\u00a0\u00bb. Ces chiffres semblent indiquer un test presque infaillible\u00a0: intuitivement, ils nous sugg\u00e8rent qu\u2019un test positif r\u00e9v\u00e8le effectivement un coupable dans 99% des cas.<\/p>\n<p>Pourtant, la r\u00e9alit\u00e9 est tr\u00e8s \u00e9loign\u00e9e de ce chiffre \u2013 du moins, si l\u2019usage de la drogue en question est peu r\u00e9pandu. Supposons par exemple que la population comprenne 1% d\u2019utilisateurs de la drogue en question. Avant tout test, la probabilit\u00e9 a priori qu\u2019un individu soit un utilisateur est de 1%. Sachant qu&rsquo;un individu est test\u00e9 positif, quelle est la probabilit\u00e9 qu&rsquo;il soit effectivement consommateur ? Faites le calcul\u00a0<em>(exemple 1 en Annexe 2)<\/em> : dans ce cas, \u00e0 peine une chance sur deux ! Stup\u00e9fiant (c\u2019est le cas de le dire), mais compr\u00e9hensible quand on le repr\u00e9sente de la mani\u00e8re suivante en partant d\u2019une population de 10.000 personnes\u00a0:<\/p>\n<p><em>Population totale\u00a0: 10000 =&gt;\u00a0<\/em><em>100 utilisateurs (1 %) et 9900 non utilisateurs (99%)<\/em><\/p>\n<p><em>Parmi les 100 utilisateurs, il y en a 99 (99 %) d\u00e9tect\u00e9s \u00e0 raison et 1 non d\u00e9tect\u00e9 \u00e0 tort (1 %).<\/em><\/p>\n<p><em>Parmi les 9900 non utilisateurs, 99 (1%) sont d\u00e9tect\u00e9s \u00e0 tort et 9801 sont non d\u00e9tect\u00e9s \u00e0 raison.<\/em><\/p>\n<p><em>Il y a donc 99 d\u00e9tect\u00e9s \u00e0 raison parmi les utilisateurs et 99 d\u00e9tect\u00e9s \u00e0 tort parmi les non utilisateurs, c\u2019est-\u00e0-dire que la moiti\u00e9 des tests positifs est due \u00e0 des non utilisateurs. \u00a0<\/em><\/p>\n<h3><strong>Le\u00e7on 2\u00a0: r\u00e9viser sa probabilit\u00e9 en fonction des \u00e9v\u00e9nements<\/strong><\/h3>\n<p>Mais quel rapport avec Luis Enrique, vous demandez-vous\u00a0? Venons-y. Tout l\u2019int\u00e9r\u00eat de cette formulation du th\u00e9or\u00e8me de Bayes, c\u2019est qu\u2019elle nous permet de r\u00e9viser notre estimation a priori de la probabilit\u00e9 d\u2019un \u00e9v\u00e9nement \u00e0 la lumi\u00e8re de faits nouveaux. Et on peut en tirer ce r\u00e9sultat g\u00e9n\u00e9ral\u00a0: une fois qu\u2019un \u00e9v\u00e9nement improbable s\u2019est produit, la probabilit\u00e9 qu\u2019il se reproduise <em>augmente<\/em>.<\/p>\n<p>Dit comme \u00e7a, cela semble \u00e0 la fois contre-intuitif et \u00e9vident. Contre-intuitif\u00a0: si j\u2019ai gagn\u00e9 au loto, je ne m\u2019attends pas \u00e0 regagner la semaine prochaine. Et pourtant \u00e9vident, comme le montre cet exemple emprunt\u00e9 \u00e0 <a href=\"http:\/\/www.amazon.fr\/Signal-Noise-Art-Science-Prediction\/dp\/0141975652\">Nate Silver<\/a>*: a priori, le 10 septembre 2001, la probabilit\u00e9 d&rsquo;une attaque terroriste utilisant un avion sur une tour new-yorkaise est infime, car la chose ne s\u2019est jamais produite. Le 11 septembre \u00e0 8h46, apr\u00e8s la premi\u00e8re attaque, cette probabilit\u00e9 doit \u00eatre r\u00e9vis\u00e9e \u00e0 la hausse, mais l&rsquo;id\u00e9e que le premier impact puisse n&rsquo;\u00eatre qu&rsquo;un accident est encore cr\u00e9dible. A 9h03, apr\u00e8s l\u2019attaque sur la Tour Sud, la probabilit\u00e9 que la collision soit une attaque terroriste, et non un accident, est une quasi-certitude. C&rsquo;est parce que l&rsquo;hyper-improbable s&rsquo;est produit qu&rsquo;il devient moins improbable. <em>(Calculs en Annexe 2, exemples 2 et 3).<\/em><\/p>\n<p>Le raisonnement est \u00e0 peu pr\u00e8s le m\u00eame pour Luis Enrique. L\u2019hypoth\u00e8se est ici\u00a0qu\u2019un match de Ligue des Champions <em>peut<\/em> se solder par un score de 5 buts d\u2019\u00e9cart. Quelle est la probabilit\u00e9 que cette hypoth\u00e8se soit vraie ? A priori \u2013 soit avant le match aller &#8211;, tr\u00e8s faible. Le <a href=\"http:\/\/www.huffingtonpost.fr\/2017\/02\/15\/les-4-stats-folles-qui-decoulent-de-ce-psg-barca\/\">HuffPost<\/a> nous apprend qu\u2019un score de 4-0 \u00e9tait cot\u00e9 \u00e0 100 contre 1 chez les bookmakers avant le match aller, et qu\u2019un tel score n\u2019avait jamais \u00e9t\u00e9 remont\u00e9 par une \u00e9quipe en comp\u00e9tition europ\u00e9enne depuis 60 ans. On peut donc dire que la probabilit\u00e9 a priori d\u2019un 5-0 \u00e9tait bien inf\u00e9rieure \u00e0 1% &#8212; disons, par hypoth\u00e8se, de 0,5%.<\/p>\n<p>Seulement voil\u00e0\u00a0: le 14 f\u00e9vrier, le PSG gagne 4-0. Que nous apprend cet \u00e9v\u00e9nement sur la possibilit\u00e9 d\u2019une victoire 5-0\u00a0? La premi\u00e8re partie de la question est facile : si un 5-0 est possible, alors un 4-0 l\u2019est \u00e9videmment aussi. Donc la probabilit\u00e9 de l\u2019observation si l\u2019hypoth\u00e8se est exacte est de 100%.<\/p>\n<p>Il est plus difficile d\u2019estimer la probabilit\u00e9 de l&rsquo;observation si l&rsquo;hypoth\u00e8se est fausse, c&rsquo;est-\u00e0-dire qu\u2019un 4-0 soit possible mais un 5-0 impossible. L\u2019affirmation de Luis Enrique n\u2019est pas <em>m\u00e9caniquement<\/em> exacte\u00a0: ce n\u2019est pas <em>parce que<\/em> les parisiens ont marqu\u00e9 4 buts que les catalans peuvent en mettre six (ni m\u00eame cinq). En th\u00e9orie, 4-0 peut \u00eatre un score \u00ab\u00a0possible mais ind\u00e9passable\u00a0\u00bb. Quelle probabilit\u00e9 assigner \u00e0 cette hypoth\u00e8se\u00a0? Evidemment, on n\u2019en sait rien, mais on peut faire varier le chiffre et tester la sensibilit\u00e9 du r\u00e9sultat.<\/p>\n<p>Et celui-ci est fort int\u00e9ressant. Si on pense (comme Luis Enrique, manifestement) que <em>si<\/em> un 4-0 est possible, <em>alors<\/em> il y a 90% de chances qu\u2019un 5-0 le soit, la probabilit\u00e9 que nous devons utiliser est de 10%. Bayes nous permet de calculer la probabilit\u00e9 du 5-0\u00a0: 4,8% (exemple 4 de l\u2019Annexe 2). C\u2019est faible dans l\u2019absolu, bien s\u00fbr, mais c\u2019est dix fois plus qu\u2019avant le match aller\u00a0! Cette probabilit\u00e9 n\u2019est d\u2019ailleurs pas tr\u00e8s loin de la cote de 12 contre 1 que les bookmakers assignaient \u00e0 la <em>remontada<\/em>. (Si l\u2019on est beaucoup plus prudent et qu\u2019on estime qu\u2019il y a 25% de chances qu\u2019un 5-0 demeure impossible m\u00eame apr\u00e8s le constat d\u2019un 4-0, alors le r\u00e9sultat est 2%\u00a0: plus faible encore, mais toujours quatre fois plus qu\u2019avant.)<\/p>\n<p>En somme, Luis Enrique est un parfait\u00a0bay\u00e9sien, qui r\u00e9vise sa probabilit\u00e9 a priori en fonction des \u00e9v\u00e9nements\u2026 et qui prouve la justesse de son calcul sur le terrain.<\/p>\n<h3><strong>Le\u00e7on 3\u00a0: choisir le bon \u00e9chantillon<\/strong><\/h3>\n<p>Encore faut-il remarquer que Luis Enrique choisit de regarder le probl\u00e8me sous un angle bien particulier. Beaucoup d\u2019experts disaient en effet simplement que remonter un 4-0 \u00e9tait impossible, puisque \u00e7a ne s\u2019\u00e9tait jamais produit.<\/p>\n<p>Pourquoi Luis Enrique ne suit-il pas ce raisonnement\u00a0?<\/p>\n<p>La raison est simple. Supposons que le Bar\u00e7a gagne 4-0 un match aller contre une \u00e9quipe notoirement plus faible &#8212; par exemple, Gijon ou Valladolid, pour faire plaisir au commentateur de Canal qui, \u00e0 la 84\u00e8me minute du match, triomphait : \u00ab\u00a0c&rsquo;est pas Gijon, c&rsquo;est pas Valladolid, c&rsquo;est le PSG !\u00a0\u00bb. Enrique n\u2019en conclura bien s\u00fbr pas qu\u2019une d\u00e9faite 5-0 est possible au retour, mais au contraire qu\u2019une nouvelle victoire de Barcelone est probable. Son raisonnement est toujours bay\u00e9sien, mais centr\u00e9 sur une hypoth\u00e8se\u00a0bien diff\u00e9rente\u00a0: il part de l\u2019hypoth\u00e8se a priori que le Bar\u00e7a est largement sup\u00e9rieur \u00e0 cette \u00e9quipe m\u00e9diocre, et la battra \u00e0 chaque match. Une victoire \u00e9crasante n\u2019est que mod\u00e9r\u00e9ment probable si cette hypoth\u00e8se est juste (on ne fait pas 4-0 tous les soirs), mais elle est infiniment improbable si l\u2019hypoth\u00e8se est fausse (on ne met quasiment jamais 4-0 \u00e0 une \u00e9quipe <em>sup\u00e9rieure<\/em>). Le 4-0 du match aller augmente donc la conviction qu\u2019a l\u2019entra\u00eeneur de la sup\u00e9riorit\u00e9 de son \u00e9quipe\u00a0: de tr\u00e8s probable a priori, celle-ci devient a posteriori quasi-certaine. (Chiffres en Annexe 2).<\/p>\n<p>L\u2019int\u00e9r\u00eat de ce contre-exemple est de nous r\u00e9v\u00e9ler la diff\u00e9rence entre le raisonnement bay\u00e9sien subtil de Luis Enrique et la statistique simpliste de ceux qui disaient\u00a0: \u00ab\u00a0\u00e7a n\u2019est jamais arriv\u00e9, donc c\u2019est impossible\u00a0\u00bb. Quand les historiens du foot observent que l\u2019on n\u2019a jamais remont\u00e9 un 4-0, ils regardent des 4-0 o\u00f9 une \u00e9quipe m\u00e9diocre s\u2019est faite \u00ab\u00a0d\u00e9rouiller\u00a0\u00bb par des champions. Dans un tel cas, le 4-0 rend bien une nouvelle d\u00e9faite <em>plus<\/em> probable. Mais Luis Enrique part du principe que le PSG et le Bar\u00e7a sont deux grandes \u00e9quipes de niveau comparable, et que quand elles s\u2019affrontent, tout peut arriver ! Pour lui, ce que r\u00e9v\u00e8le le 4-0 du Parc des Princes, ce n&rsquo;est pas un \u00e9cart de niveau, c&rsquo;est un accident du destin. Et Bayes nous le dit : la survenance d&rsquo;un accident du destin rend <em>plus<\/em> probable un autre accident du m\u00eame genre, \u00e9ventuellement en sens inverse.<\/p>\n<p>Seule consolation pour le PSG, le raisonnement d\u2019Enrique d\u00e9montre qu&rsquo;il est tout \u00e0 fait d&rsquo;accord avec St\u00e9phane Guy : le PSG, ce n&rsquo;est pas Gijon, ni Valladolid, mais une grande \u00e9quipe de niveau finalement assez \u00e9quivalent \u00e0 celui de Barcelone. Il lui fait donc, par Bayes interpos\u00e9, un grand compliment ! Sans doute est-ce l\u00e0 le seul \u00e9loge que ce match aura valu aux malheureux parisiens&#8230;<\/p>\n<p><strong>Annexe 1 : La formule de thomas Bayes<\/strong><\/p>\n<p>Le th\u00e9or\u00e8me du pasteur et math\u00e9maticien britannique (1702-1761) permet de calculer des probabilit\u00e9s conditionnelles. Vous vous rappelez peut-\u00eatre avoir appris comment calculer la probabilit\u00e9 de \u00ab\u00a0A sachant B\u00a0\u00bb \u00e0 partir des probabilit\u00e9s de A, B, et \u00ab\u00a0B sachant A\u00a0\u00bb. La formulation du th\u00e9or\u00e8me qui nous int\u00e9resse ici est une permutation de la formule, qui permet de r\u00e9viser la probabilit\u00e9 qu\u2019une hypoth\u00e8se soit exacte \u00e0 la lumi\u00e8re d\u2019une observation nouvelle\u00a0:<\/p>\n<p><strong>P = xy \/ (xy+ z(1-x))<\/strong><\/p>\n<p>o\u00f9 :<\/p>\n<p>x est la probabilit\u00e9 a priori que l\u2019hypoth\u00e8se soit exacte ;<\/p>\n<p>y est la probabilit\u00e9 de l\u2019observation si l\u2019hypoth\u00e8se est exacte ;<\/p>\n<p>z est la probabilit\u00e9 de l\u2019observation si l\u2019hypoth\u00e8se est fausse.<\/p>\n<p><strong>Annexe 2 : Les exemples\u00a0de ce post<\/strong><\/p>\n<p>Le tableau ci-dessous illustre (avec des valeurs \u00e9videmment discutables) les calculs qui sous-tendent les exemples mentionn\u00e9s ci-dessus.<\/p>\n<p><a href=\"http:\/\/variances.eu\/wp-content\/uploads\/2017\/05\/Image1.png\"><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-2219 aligncenter\" src=\"http:\/\/variances.eu\/wp-content\/uploads\/2017\/05\/Image1-300x178.png\" width=\"612\" height=\"363\" srcset=\"https:\/\/variances.eu\/wp-content\/uploads\/2017\/05\/Image1-300x178.png 300w, https:\/\/variances.eu\/wp-content\/uploads\/2017\/05\/Image1-1024x609.png 1024w, https:\/\/variances.eu\/wp-content\/uploads\/2017\/05\/Image1-600x357.png 600w, https:\/\/variances.eu\/wp-content\/uploads\/2017\/05\/Image1.png 1073w\" sizes=\"(max-width: 612px) 100vw, 612px\" \/><\/a><\/p>\n<p>(*)\u00a0: Exemple emprunt\u00e9 \u00e0 Nate Silver, \u00ab\u00a0<em>The signal and the noise\u00a0: Why So Many Predictions Fail &#8211; But Some Don&rsquo;t <\/em>\u00bb, 2012, Penguin Group<\/p>\n<p>La probabilit\u00e9 z que l\u2019impact soit un accident est calcul\u00e9e \u00e0 partir de l\u2019historique des accidents d\u2019avion<\/p>\n<p>&nbsp;<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Publi\u00e9 sur le compte Linkedin de l\u2019auteur le 13 mars 2017 &#8211; Avec l\u2019aimable autorisation de l\u2019auteur Luis Enrique, le coach de Barcelone, n\u2019est pas seulement un grand entra\u00eeneur\u00a0: c\u2019est un expert en statistiques. Et s\u2019il a administr\u00e9 au PSG une le\u00e7on de football, il nous a offert par la m\u00eame occasion trois le\u00e7ons de [&hellip;]<\/p>\n","protected":false},"author":70,"featured_media":2221,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_et_pb_use_builder":"","_et_pb_old_content":"","_et_gb_content_width":"","_exactmetrics_skip_tracking":false,"_exactmetrics_sitenote_active":false,"_exactmetrics_sitenote_note":"","_exactmetrics_sitenote_category":0,"footnotes":""},"categories":[150,137,133],"tags":[],"class_list":["post-2218","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-mai2017","category-sport","category-themes","et-has-post-format-content","et_post_format-et-post-format-standard"],"_links":{"self":[{"href":"https:\/\/variances.eu\/index.php?rest_route=\/wp\/v2\/posts\/2218","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/variances.eu\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/variances.eu\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/variances.eu\/index.php?rest_route=\/wp\/v2\/users\/70"}],"replies":[{"embeddable":true,"href":"https:\/\/variances.eu\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=2218"}],"version-history":[{"count":0,"href":"https:\/\/variances.eu\/index.php?rest_route=\/wp\/v2\/posts\/2218\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/variances.eu\/index.php?rest_route=\/wp\/v2\/media\/2221"}],"wp:attachment":[{"href":"https:\/\/variances.eu\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=2218"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/variances.eu\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=2218"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/variances.eu\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=2218"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}