{"id":6660,"date":"2022-05-09T07:15:58","date_gmt":"2022-05-09T05:15:58","guid":{"rendered":"https:\/\/variances.eu\/?p=6660"},"modified":"2022-05-09T07:17:50","modified_gmt":"2022-05-09T05:17:50","slug":"les-donnees-alternatives-en-finance","status":"publish","type":"post","link":"https:\/\/variances.eu\/?p=6660","title":{"rendered":"Les donn\u00e9es alternatives en finance"},"content":{"rendered":"<p>L\u2019importance des donn\u00e9es ne fait que cro\u00eetre dans la gestion d\u2019actifs. Cette observation est \u00e9videmment pertinente pour la gestion alternative mais aussi d\u00e9sormais pour la gestion classique. La course \u00e0 la performance a fait que le <em>Big Data<\/em> est le pain quotidien des <em>Hedge Funds<\/em> depuis de nombreuses ann\u00e9es, ces derniers \u00e9tant depuis longtemps habitu\u00e9s \u00e0 manipuler de grands volumes de donn\u00e9es. Mais de nouvelles donn\u00e9es, aussi originales que pertinentes, arrivent d\u00e9sormais entre les mains de gestionnaires r\u00e9put\u00e9s \u00ab\u00a0moins sophistiqu\u00e9s\u00a0\u00bb (au sens des techniques quantitatives employ\u00e9es ou de l\u2019importance de la vitesse de transaction).<\/p>\n<h3><strong>Cadre de l\u2019\u00e9change<\/strong><\/h3>\n<p>Le 10 F\u00e9vrier dernier s\u2019est tenu le s\u00e9minaire en ligne sur le th\u00e8me \u00ab\u00a0<em>Alternative Data Use In Asset Management<\/em><em>\u00a0<\/em>\u00bb. Ce s\u00e9minaire a eu lieu en partenariat avec l\u2019Association Fran\u00e7aise de Gestion et l\u2019Institut Louis Bachelier (plus particuli\u00e8rement l\u2019initiative FaIR). Un lecteur int\u00e9ress\u00e9 pourra trouver ici (<span style=\"text-decoration: underline;\"><span style=\"color: #0000ff;\"><a style=\"color: #0000ff; text-decoration: underline;\" href=\"https:\/\/www.institutlouisbachelier.org\/evenement\/webinar-alternative-data-use-in-asset-management\/\">https:\/\/www.institutlouisbachelier.org\/evenement\/webinar-alternative-data-use-in-asset-management\/<\/a><\/span><\/span>) l\u2019annonce de l\u2019\u00e9v\u00e8nement et ici (<span style=\"text-decoration: underline; color: #0000ff;\"><a style=\"color: #0000ff; text-decoration: underline;\" href=\"https:\/\/www.institutlouisbachelier.org\/multimedia\/ilb-replay\/\">https:\/\/www.institutlouisbachelier.org\/multimedia\/ilb-replay\/<\/a><\/span>) les ressources vid\u00e9o pour revoir l\u2019\u00e9v\u00e8nement en totalit\u00e9. Apr\u00e8s une introduction par Marie Bri\u00e8re (Amundi), deux intervenants acad\u00e9miques se sont succ\u00e9d\u00e9s pour animer ce s\u00e9minaire\u00a0: Alexander Denev (Turnleaf Analytics) et Ronnie Sadka (Boston College). Une table ronde, mod\u00e9r\u00e9e par Charles-Albert LeHalle (ADIA), a ensuite permis de poursuivre le d\u00e9bat, en confrontant les points de vue de Ghizlaine Amrani (Quantcube), Pierre Haren (Causality Link), et Eric Lebigot (CFM).<\/p>\n<p>Les donn\u00e9es d\u00e9sormais entre les mains des gestionnaires d\u2019actifs sont nombreuses et diverses, diff\u00e9rentes et complexes. Le point crucial est qu\u2019elles permettent une information toujours plus pointue sur les comportements et les liens entre agents, consommateurs, institutions ou compagnies. Par cons\u00e9quent, le potentiel pour l\u2019investissement est \u00e9norme. Les g\u00e9rants d\u2019actifs et les <em>Hedge Funds<\/em> l\u2019ont bien compris et investissent d\u00e9sormais massivement dans ce domaine. Cette tendance n\u2019est pas pr\u00e8s de faiblir, notamment dans le cadre de l\u2019int\u00e9r\u00eat croissant pour l\u2019investissement socialement responsable. Le but de ce s\u00e9minaire \u00e9tait donc de pr\u00e9senter des cas d\u2019usage, leur valeur ajout\u00e9e pour les processus d\u2019investissement dans toute leur diversit\u00e9, leurs particularit\u00e9s, la mani\u00e8re dont la v\u00e9rification avant utilisation peut se faire, et la fa\u00e7on dont elles peuvent impacter l\u2019efficience de march\u00e9.<\/p>\n<h3><strong>Nature des donn\u00e9es alternatives<\/strong><\/h3>\n<p>Si il n\u2019y a bien entendu pas de d\u00e9finition officielle de ce qu\u2019est ou de ce que devrait \u00eatre une donn\u00e9e alternative, Alexander Denev a cependant tent\u00e9 de le faire. Les donn\u00e9es alternatives en finance sont celles qui sont en g\u00e9n\u00e9ral moins utilis\u00e9es parmi les acteurs financiers, plus on\u00e9reuses, avec un historique plus court, et avec des d\u00e9fis d\u2019utilisation plus grands (des donn\u00e9es brutes difficile \u00e0 manipuler avant de pouvoir \u00eatre utilis\u00e9es). Ces donn\u00e9es peuvent \u00eatre des donn\u00e9es \u00ab\u00a0hors march\u00e9s\u00a0\u00bb (donc des donn\u00e9es ne venant pas directement des places ou des \u00e9changes), ou \u00eatre le produit indirect d\u2019autres processus (transactions, \u00e9changes, navigation physique ou virtuelle, empreinte num\u00e9rique, etc.).<\/p>\n<p>Nous pourrions faire un inventaire \u00e0 la Pr\u00e9vert des types de donn\u00e9es auxquelles il est d\u00e9sormais possible d\u2019avoir acc\u00e8s : donn\u00e9es de localisation, photos satellite, donn\u00e9es de chaine de production, donn\u00e9es textuelles de type web, twitter, forums, r\u00e9seaux sociaux ; donn\u00e9es de transaction, de cartes de cr\u00e9dit ou donn\u00e9es de march\u00e9 haute-fr\u00e9quence\u2026, les exemples sont nombreux.<\/p>\n<p>Ces donn\u00e9es arrivent d\u00e9sormais avec des volumes et une vari\u00e9t\u00e9 croissants. Sous forme de texte, d\u2019images, de vid\u00e9o, plus ou moins bien format\u00e9es, et parfois totalement non structur\u00e9es. Pour cette derni\u00e8re situation on peut penser aux \u00e9changes qu\u2019il peut y avoir sur les forums de jeux vid\u00e9o, forums sur lesquels des conseils d\u2019investissement ou des actions collectives \u00e0 mener contre telle ou telle compagnie\u00a0! En cons\u00e9quence, cette grande variabilit\u00e9 m\u00e8ne \u00e0 de grands biais et de grands d\u00e9fis quant \u00e0 leur assimilation. Le traitement qu\u2019elles n\u00e9cessitent implique \u00e9videmment une dose importante de <em>Machine Learning<\/em> tout au long de la cha\u00eene.<\/p>\n<h3><strong>Biais inh<\/strong><strong>\u00e9rents aux donn\u00e9es alternatives<\/strong><\/h3>\n<p>Sur le fond, il n\u2019y a pas vraiment de limite tant que la validit\u00e9 statistique du produit final est assur\u00e9e\u00a0: toute donn\u00e9e potentielle est bonne \u00e0 consid\u00e9rer. Cependant, apprentissage automatis\u00e9 et donn\u00e9e brute peuvent ne pas faire bon m\u00e9nage. Un enjeu pratique (potentiellement le plus grand) qui ne saute pas aux yeux est l\u2019attribution d\u2019une information \u00e0 l\u2019entit\u00e9 qu\u2019elle concerne (en anglais, <em>entity matching<\/em>). En effet, comment \u00eatre s\u00fbr d\u2019extraire d\u2019un magma de texte, des informations pertinentes et parfaitement attribu\u00e9es \u00e0 Tesla, Google, ou Kering\u00a0? Sans m\u00eame parler des donn\u00e9es manquantes, de leur absence de structure ou des donn\u00e9es aberrantes. Une particularit\u00e9 de ces donn\u00e9es est en particulier leur manque de profondeur\u00a0: si la technique de collecte (ex\u00a0: des images satellite) ou la source (ex\u00a0: forum Reddit) est r\u00e9cente, la donn\u00e9e sera par nature limit\u00e9e dans le temps. Toute simulation l\u2019utilisant ne pourra qu\u2019\u00eatre faite avec un recul temporel limit\u00e9, la significativit\u00e9 statistique de l\u2019exercice \u00e9tant alors potentiellement tr\u00e8s fragile.<\/p>\n<p>Un d\u00e9faut majeur de ces donn\u00e9es est qu\u2019elles peuvent pr\u00e9senter, par leur nature, leur fournisseur, ou leur caract\u00e8re r\u00e9cent, des biais importants (s\u00e9lection, survivance par exemple)\u00a0; et dispara\u00eetre apr\u00e8s \u00eatre r\u00e9cemment apparues, si le fournisseur de donn\u00e9es fait faillite. S\u2019ajoutent \u00e0 cela les questions l\u00e9gales\u00a0: est-on s\u00fbr de pouvoir toujours les utiliser, d\u2019autant que les r\u00e9gulations sur ce point sont h\u00e9t\u00e9rog\u00e8nes entre l\u2019Europe et les Etats-Unis pour ne citer que ces deux r\u00e9gions.<\/p>\n<h3><strong>Utilisation de ces donn\u00e9es<\/strong><\/h3>\n<p>Ces donn\u00e9es peuvent \u00eatre, et sont \u00e9videmment utilis\u00e9es par des gestionnaires d\u2019actifs pour g\u00e9n\u00e9rer des signaux d\u2019investissement. Dans ce cas pr\u00e9cis, organiser une cha\u00eene compl\u00e8te et automatis\u00e9e de la donn\u00e9e au signal d\u2019investissement est le principal d\u00e9fi. Mais l\u2019utilisation des donn\u00e9es alternatives ne se restreint pas \u00e0 cela, et l\u2019on voit aussi de nombreuses situations o\u00f9 ces donn\u00e9es apportent une aide pr\u00e9cieuse pour de l\u2019aide \u00e0 la d\u00e9cision d\u2019une nature diff\u00e9rente\u00a0: investissement responsable, \u00e9tudes macro\u00e9conomiques, mesures d\u2019inflation, inf\u00e9rence sur les points d\u2019inflexion ou la d\u00e9tection de tendance, \u00ab\u00a0<em>nowcasting<\/em>\u00a0\u00bb, etc. Mais aussi pour mesurer le comportement des consommateurs, inf\u00e9rer les croyances et les pr\u00e9visions d\u2019experts, comprendre la coordination potentielle entre les investisseurs, d\u00e9tecter automatiquement des th\u00e8mes d\u2019avenir, ou identifier des relations implicites entre des compagnies.<\/p>\n<h3><strong>Conclusion<\/strong><\/h3>\n<p>Ce ne sont l\u00e0 que quelques exemples mais l\u2019id\u00e9e est que ces donn\u00e9es peuvent \u00e0 nouveau permettre, pour l\u2019investissement purement quantitatif, la perspective de pouvoir r\u00e9introduire des raisonnements ou des th\u00e9matiques \u00e9conomiques. Cette possibilit\u00e9 est acquise lorsque d\u2019un flot de donn\u00e9es diverses \u00e9merge un narratif pertinent\u00a0: par exemple, \u00eatre capable d\u2019automatiquement d\u00e9tecter en janvier 2020 que la probl\u00e9matique du Covid \u00e9merge quantitativement, au-del\u00e0 de nos perceptions objectives de son danger ou de son caract\u00e8re inoffensif. Un autre exemple serait d\u2019\u00eatre capable de pr\u00e9voir les augmentations de taux \u00e0 partir du corpus de texte des minutes des banques centrales pour en extraire le ton ou les intentions. Ceci fait qu\u2019il n\u2019y a pas parmi les utilisateurs de ces donn\u00e9es que des fonds quantitatifs sophistiqu\u00e9s, mais aussi des fonds plus traditionnels, des discr\u00e9tionnaires, ou m\u00eame des \u00ab\u00a0<em>fintechs<\/em>\u00a0\u00bb.<\/p>\n<p>Ces donn\u00e9es permettent aussi de casser le paradigme implicite d\u2019utilisation d\u2019un signal en investissement quantitatif\u00a0: une donn\u00e9e, un signal. Ici, l\u2019enrichissement des observables du monde \u00e9conomique autorise plus de stationnarit\u00e9 sur un \u00ab\u00a0monde r\u00e9el, observable\u00a0\u00bb, sans que la donn\u00e9e soit accept\u00e9e ou rejet\u00e9e en fonction de sa capacit\u00e9 \u00e0 g\u00e9n\u00e9rer un signal d\u2019achat-vente non stationnaire, uniquement s\u00e9lectionn\u00e9 sur sa propension \u00e0 g\u00e9n\u00e9rer des profits. En d\u2019autres termes, ces donn\u00e9es sont tr\u00e8s utiles pour capter des tendances micro- ou macro\u00e9conomiques avec un haut niveau de d\u00e9tail, en permettant de s\u2019abstraire du contexte financier imm\u00e9diat. Charge aux investisseurs ensuite de les utiliser ou non, selon leur philosophie et leur mandat. Mais cette fen\u00eatre ouverte sur une analyse quantitative plus fine des \u00e9tats du monde \u00e9conomique est assur\u00e9ment nouvelle.<\/p>\n<h3><strong>Bibliographie<\/strong><\/h3>\n<p>Vid\u00e9o de l\u2019\u00e9v\u00e8nement : <span style=\"text-decoration: underline;\"><span style=\"color: #0000ff;\"><a style=\"color: #0000ff; text-decoration: underline;\" href=\"https:\/\/www.institutlouisbachelier.org\/multimedia\/ilb-replay\/\">https:\/\/www.institutlouisbachelier.org\/multimedia\/ilb-replay\/<\/a><\/span><\/span><\/p>\n<p>Alexander Denev \u2013 The Book of Alternative Data (Wiley, 2020)<\/p>\n<p>Chris Doloc \u2013 Applications of Computational Intelligence in Data-Driven Trading (Wiley, 2019)<\/p>\n","protected":false},"excerpt":{"rendered":"<p>L\u2019importance des donn\u00e9es ne fait que cro\u00eetre dans la gestion d\u2019actifs. Cette observation est \u00e9videmment pertinente pour la gestion alternative mais aussi d\u00e9sormais pour la gestion classique. La course \u00e0 la performance a fait que le Big Data est le pain quotidien des Hedge Funds depuis de nombreuses ann\u00e9es, ces derniers \u00e9tant depuis longtemps habitu\u00e9s [&hellip;]<\/p>\n","protected":false},"author":308,"featured_media":6663,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_et_pb_use_builder":"","_et_pb_old_content":"","_et_gb_content_width":"","_exactmetrics_skip_tracking":false,"_exactmetrics_sitenote_active":false,"_exactmetrics_sitenote_note":"","_exactmetrics_sitenote_category":0,"footnotes":""},"categories":[15,5],"tags":[],"class_list":["post-6660","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-data-science","category-gestion-dactifs","et-has-post-format-content","et_post_format-et-post-format-standard"],"_links":{"self":[{"href":"https:\/\/variances.eu\/index.php?rest_route=\/wp\/v2\/posts\/6660","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/variances.eu\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/variances.eu\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/variances.eu\/index.php?rest_route=\/wp\/v2\/users\/308"}],"replies":[{"embeddable":true,"href":"https:\/\/variances.eu\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=6660"}],"version-history":[{"count":0,"href":"https:\/\/variances.eu\/index.php?rest_route=\/wp\/v2\/posts\/6660\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/variances.eu\/index.php?rest_route=\/wp\/v2\/media\/6663"}],"wp:attachment":[{"href":"https:\/\/variances.eu\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=6660"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/variances.eu\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=6660"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/variances.eu\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=6660"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}