Les paris sportifs ont longtemps passionné les économistes et les statisticiens. Griffith (1949) a montré très tôt que les parieurs de courses de chevaux mettent trop d’argent sur les chevaux qui ont peu de chances de gagner, et trop peu sur ceux qui ont le plus de chances de gagner. Cette tendance à sous-enchérir sur l’événement le plus probable a été observée dans tous les paris sportifs, où « l’événement le plus probable » est calculé sur la base de statistiques récentes. Et elle peut être expliquée de manière fondamentale par la mécanique des paris mutuels : le parieur oppose ses croyances à celles de la foule, car les divers paris vont déterminer les cotes.

La prévision avant les sondages

Aujourd’hui, dans les mois qui précèdent chaque élection, on se retrouve noyé sous les sondages, effectués tous les jours (et commentés plusieurs fois par jour, comme si du bruit d’estimation méritait des exégèses). Comme le rappelait Frédéric Dabi (directeur général adjoint de l’Ifop) dans un débat organisé par la revue Risques en 2017, « les sondages sont une indication du rapport des forces électorales, en aucun cas une prédiction », mais c’est pourtant bien souvent dans l’idée d’avoir une prédiction qu’ils sont utilisés.

Mais si on remonte dans le temps, Rhode & Strumpf (2008) rappelle que d’autres techniques ont été utilisées, avant que l’idée des sondages ne s’impose, en particulier les paris. En 1549, Matteo Dandolo (ambassadeur de Vénétie) notait que « il est donc plus que clair que les commerçants sont très bien informés de l’état du scrutin, et que les préposés des cardinaux en conclave (i conclavisti) participent avec eux à des paris, ce qui entraîne donc plusieurs dizaines de milliers de couronnes à changer de mains » comme le raconte Baumgartner (2003). Plus proches de nous, les marchés de paris lors des élections ont été populaires aux États-Unis, jusqu’à la seconde guerre mondiale. Rhode & Strumpf (2008) avance plusieurs raisons pour la perte d’intérêt au cours de la seconde moitié du XXème siècle : les améliorations des techniques de sondages… et la légalisation des paris sur chevaux. Mais les sites de paris en ligne ont relancé l’intérêt pour les paris, quels qu’ils soient. Car les sites que nous évoquions dans un article précédent ne se limitent souvent pas aux paris sportifs, mais permettent aussi des paris sur une magnitude de tremblement de terre, un vainqueur aux Oscars, voire l’observation du boson de Higgs, comme le proposait intrade.com, qui a été liquidé en 2015. Comme le montre onlinebettingsites.com, on pouvait parier sur les élections françaises en 2017, ou sur le référendum sur le Brexit (même si pour ce dernier, les marchés prédictifs n’ont pas été en me-sure de refléter la croyance des foules, comme le rappelle un article de The Economist).

Mathématiques du « pari-mutuel »

La théorie du « pari-mutuel » n’est pas sans rappeler la mutualisation des risques, fondement important du mécanisme d’assurance, cher aux actuaires [1]. En travaillant sur les marchés des paris hippiques, Edmund Eisenberg et David Gale ont obtenu, dans un court article de trois pages, Consensus of Subjective Probabilities, des résultats relativement généraux, tant que le pari est statique.

Supposons que I joueurs puissent parier sur J chevaux. Chaque joueur possède une somme totale b_i, que l’on normalisera de telle sorte que b_i désigne la part de la somme totale misée (et donc b_1 +…+ b_I =1). Le joueur i peut alors miser la somme  \beta_{{i,j}} sur le cheval j (avec ici  \beta_{{i,1}}+…+ \beta_{{i,J}} = b_i). Lorsque les paris sont clôturés, on note \pi_j le montant parié sur le cheval j, autrement dit \beta_{{i,1+…+\beta_{{I,j = \pi_j). La contrainte de budget impose que la somme de ces montants soit égale à 1, ce qui donne aux \pi_j une interprétation probabiliste. Nous reviendrons sur l’utilisation de ces « prix » par la suite. On peut aussi noter \theta_j la cote de gain (payoff-odds) définie comme \pi_ j^^^{{ -1}}-1, de telle sorte que \pi_j=(1+\theta_j)^{{-1. Si on suppose qu’une portion 1-\alpha est gardée par le bookmaker, alors \pi_j=\alpha (1+\theta_j)^{{-1 et \theta_j=(\alpha -\pi_j)/\pi_j. Les rendements espérés sur chacun des chevaux doivent être égaux, à l’équilibre, au rendement net attendu, où l’espérance est calculée sous la probabilité \pi, de manière à refléter les croyances de tous les parieurs, soit ici

\pi_j\theta_j+(1 -\pi_j)(-1)=\alpha-1

Le résultat essentiel du modèle de Eisenberg & Gale est de montrer qu’il existe un équilibre sur ce marché. Plus précisément, la fraction misée sur chaque cheval doit être égale à la probabilité du mar-ché du cheval. Pour arriver à cet équilibre, il est souvent supposé que les cotes d’équilibre sont trou-vées par un commissaire-priseur (ce rôle sera joué par le bookmaker). Comme le notait Blough (2008), l’hypothèse selon laquelle aucun pari n’est fait tant que les cotes ne sont pas équilibrées est une hypothèse qui se vérifie effectivement sur les courses hippiques.

Si on suppose que chaque parieur est neutre au risque (et cherche à maximiser son espérance de gain) et que ses croyances sont matérialisées par un vecteur de probabilités p_i=(p_{{i1, …,p_{{iJ) – au sens où le joueur i pense que le cheval j va gagner avec une probabilité p_{{ij – alors, à l’équilibre, si \beta_{{i,j >0,

p_{{ij}}=\pi_j max \left \{ p_{{is}}/ \pi_s\right \}

où argmax{p_{{is}}/\pi_s}= argmax{ p_{{is}}(\theta_s+1 )} est le cheval sur lequel le parieur  i doit tout miser s’il mise sur un seul cheval. Blough (2008) revient longuement sur la description de cet équilibre, et l’étend au cas où les agents ont potentiellement de l’aversion pour le risque (mais la même) et des croyances potentiellement différentes. Cet équilibre est alors décrit comme un consensus de croyance.

Dans un article intitulé Interpreting the Predictions of Prediction Markets, Charles Manski a proposé d’utiliser cette théorie pour interpréter ces prix, en lien avec les approches plus classiques en écono-mie, comme les prix d’Arrow-Debreu.

Pour illustrer ce consensus, considérons une finale de Coupe du monde qui devra aboutir soit à la victoire de A, soit la victoire de B. Imaginons un contrat offrant 1$ si A gagne, et que ce contrat soit proposé au prix \pi_A. Si on n’autorise pas d’arbitrage, on a une loi du prix unique, et on en déduit que \pi_B=1-\pi_A. Imaginons un joueur qui pense que la probabilité que A gagne est supérieure à \pi_A, soit, avec les notations précédentes, p_{{iA}}>\pi_A. Dans ce cas, le joueur a intérêt à parier tout son agent sur la victoire de A, c’est-à-dire à acheter ce contrat. La demande agrégée pour ce titre sera alors

[b_1P[p_{{1A}} > \pi_A] + ...+ b_IP[p_{{IA}} > \pi_A]] / \pi_A

et on aura un équilibre si la demande agrégée pour les deux titres vérifie

[b_1P[p_{{1A}} > \pi_A] + ...+ b_IP[p_{{IA}} > \pi_A]] / \pi_A = [b_1P[p_{{1A}} < \pi_A] + ...+ b_IP[p_{{IA}} < \pi_A]] / \pi_B

de telle sorte que

\pi_A=[b_1P[p_{{1A}} > \pi_A] + ...+ b_iP[p_{{iA}} > \pi_A]] + ... + b_IP[p_{{IA}} > \pi_A]

ce qui permet d’écrire le prix comme une moyenne des croyances des joueurs.

On notera ici que l’équilibre est statique, permettant juste au bookmaker de fixer une cote. Récemment, Agrawal et al. (2014) a proposé un algorithme pour équilibrer, en temps continu, ce marché. On pourra aussi noter que cette notion d’équilibre apparait dans de nombreux algorithmes, comme dans le marché dit de Fisher.

Le pouvoir prédictif des prix

Mais cette idée de voir dans les prix une agrégation des croyances des joueurs n’est pas nouvelle ! En 1655, dans Van Rekeningh in Spelen van Gelucken, (publié en latin sous le titre ‘De Ratiociniis in Aleæ Ludo‘), Christiaan Huyghens a proposé d’extraire des informations sur les croyances à partir des prix. En 1671, Wilhelmina de Witt a noté que, comme le prix d’un contrat versant une rente jusqu’au décès pouvait être vu comme une moyenne pondérée d’annuités (à maturité fixe), on pouvait, en observant les prix des différents contrats d’assurance, extraire des probabilités interprétées comme des probabilités de survie.

Ces probabilités sont « subjectives » comme les appelaient Bruno de Finetti ou Frank Ramsey. Ce dernier ne voyait pas les probabilités sous un angle fréquentiste, mais comme une mesure du degré de croyance – « a degree of belief », qui pouvait se mesurer au travers de paris – « through betting odds », dans Truth and Probability (en 1926). C’est finalement ce que dit la théorie présentée par Kenneth Arrow en 1953, et approfondie par Gérard Debreu en 1959, instaurant les « prix d’Arrow-Debreu ».

De nombreux sites internet utilisent les cotes des paris pour en déduire les croyances des joueurs, exprimées abusivement comme la probabilité qu’une équipe gagne une compétition. On peut d’ailleurs noter les travaux menés l’été dernier par des doctorants de l’université de Rennes qui avaient comparé les cotes sur les sites de paris en ligne, et les prévisions obtenues par plusieurs algorithmes (allant d’un classifieur bayésien naïf à du boosting, du support vector machine ou des réseaux de neurones). Un numéro spécial de The Economist, paru en 2007, et intitulé The Future of Futurology, notait que « the most heeded futurists these days are not individuals, but prediction markets, where the informed guesswork of many is consolidated into hard probability ». Cette idée est aujourd’hui largement revenue au goût du jour, comme le prédisait l’article de Chen & Pennock (2010) paru dans AI Magazine.


Références
Agrawal, Shipra, Delage, Erick, Peters, Mark, Wang, Zizhuo & Ye, Yinyu (2014). A Unified Framework for Dynamic Prediction Market Design. Operations Research.
Baron, Ken & Lange, Jeffrey (2006). Parimutuel Applications In Finance: New Markets for New Risks. Springer.
Baumgartner, Frederic (2003) Behind locked doors: a history of papal elections. Palgrave.
Blough, Stephen R. (2008) Differences of opinion at the racetrack. In Efficiency of Racetrack Betting Markets, 323-341, World Scientific.
Chen, Yiling & Pennock, David (2010). Designing Markets for Prediction. AI Magazine.
Decker, Wolfgang & Thuillier, Jean-Paul (2004). Le sport dans l’antiquité. Picard.
Eisenberg, Edmund & Gale, David (1959). Consensus of Subjective Probabilities: The Pari-Mutuel Method. Annals of Mathematical Statistics, 30:1, 165-168.
Griffith, RM (1949) Odds adjustments by American horse-race bettors. The American Journal of Psychology, 62, 290-294.
Manski, Charles (2005) Interpreting the Predictions of Prediction Markets. NBER 10359.
Rhode, Paul, W. & Strumpf, Koleman (2008) Historical Political Futures Markets: An International Perspective. NBER 14377.


[1] Baron & Lange (2006) revient longuement sur la comparaison entre la valorisation dite « risque neutre » en finance (reposant sur la loi du prix unique et celle d’arbitrage), et celle relative au « pari-mutuel ». Ils parlent ainsi de « self-hedging » car, dans un pari, les parieurs partagent les gains au prorata de leur mise initiale. Ce qui n’est pas sans rappeler le fonctionnement des mutuelles d’assurance, où l’argent qui servira à indemniser les sinistrés doit correspondre au total des primes demandées.