{"id":3621,"date":"2018-11-02T08:45:01","date_gmt":"2018-11-02T06:45:01","guid":{"rendered":"http:\/\/variances.eu\/?p=3621"},"modified":"2018-11-02T09:54:30","modified_gmt":"2018-11-02T07:54:30","slug":"notes-de-lecture-apprentissage-statistique-donnees-massives","status":"publish","type":"post","link":"https:\/\/variances.eu\/?p=3621","title":{"rendered":"Notes de lecture : \u00ab Apprentissage statistique et donn\u00e9es massives \u00bb*"},"content":{"rendered":"<p>L\u2019arriv\u00e9e du monde num\u00e9rique au milieu des ann\u00e9es 1990, son d\u00e9ploiement dans pratiquement tous les secteurs d\u2019activit\u00e9s et sa vitesse de diffusion aupr\u00e8s des m\u00e9nages dans le monde entier, ont eu pour effet, pour le statisticien, la mise \u00e0 disposition de quantit\u00e9s in\u00e9dites de donn\u00e9es, notamment celles provenant des r\u00e9seaux de communication et du web. M\u00eame si historiquement la statistique s\u2019est d\u00e9velopp\u00e9e au fil des si\u00e8cles sous le paradigme de l\u2019exhaustivit\u00e9 (par exemple, les recensements d\u00e9mographiques, agricoles, industriels), en d\u00e9pit de fortes limites d\u2019observation, le XX<sup>\u00e8me<\/sup>si\u00e8cle a vu la statistique moderne \u00e9merger dans le contexte de la raret\u00e9 des donn\u00e9es, illustr\u00e9 par le paradigme des donn\u00e9es d\u2019\u00e9chantillonnage depuis l\u2019expos\u00e9 fondateur d\u2019Anders N. Kiaer en 1895 et la th\u00e9orie de Jerzy Neyman en 1934.<\/p>\n<p>Les donn\u00e9es nombreuses de l\u2019univers num\u00e9rique apportent de nouveaux d\u00e9fis au statisticien, qui doit leur donner du sens en oubliant le mod\u00e8le statistique ou probabiliste qui les a engendr\u00e9es. Tels sont les objectifs du <em>learning<\/em>, de l\u2019apprentissage statistique. Le d\u00e9fi est d\u2019autant plus complexe \u00e0 relever que le monde num\u00e9rique est celui du \u00ab\u00a0temps r\u00e9el\u00a0\u00bb, et l\u2019apport d\u2019autres disciplines comme l\u2019informatique et l\u2019optimisation est n\u00e9cessaire pour stocker et traiter le plus rapidement possible les quantit\u00e9s de donn\u00e9es disponibles.<\/p>\n<p>Cet ouvrage, publi\u00e9 aux Editions Technip (Paris), a \u00e9t\u00e9 coordonn\u00e9 par Myriam Maumy-Bertrand, Gilbert Saporta et Christine Thomas-Agnan. Il est issu de la collaboration r\u00e9ussie de sp\u00e9cialistes r\u00e9put\u00e9s, dont Sylvain Arlot (Universit\u00e9 Paris Sud), Philippe Besse (INSA de Toulouse), St\u00e9phane Canu (INSA de Rouen), Jean-Michel Poggi (Universit\u00e9 Paris Descartes &amp; LMO, Universit\u00e9 Paris-Sud Orsay), Emmanuel Viennet (Universit\u00e9 Paris 13) et Nathalie Villa-Vialaneix (INRA, Toulouse).<\/p>\n<p>Les auteurs ont \u00e9t\u00e9 les acteurs des 17<sup>\u00e8mes<\/sup> Journ\u00e9es d\u2019\u00e9tude en statistique organis\u00e9es par la Soci\u00e9t\u00e9 Fran\u00e7aise de Statistique (SFDS). H\u00e9riti\u00e8re de la Soci\u00e9t\u00e9 de Statistique de Paris (SSP) fond\u00e9e en 1860, de l\u2019Association pour la Statistique et ses Utilisations (ASU) fond\u00e9e en 1969 et de la Soci\u00e9t\u00e9 de Statistique de France (SSF) fond\u00e9e en 1976, dont la fusion lui a donn\u00e9 naissance en 1997, la SFDS a pour objectif de favoriser les d\u00e9veloppements de la statistique et d\u2019assurer la repr\u00e9sentation de l\u2019ensemble des utilisateurs, enseignants et chercheurs.<\/p>\n<p>Dans ce livre, le lecteur trouvera une synth\u00e8se des fondements et des travaux les plus r\u00e9cents dans le domaine de l\u2019apprentissage statistique, en distinguant apprentissage supervis\u00e9 ou non supervis\u00e9, avec des applications dans des domaines vari\u00e9s.<\/p>\n<p>Il est structur\u00e9 en cinq chapitres. Le premier contient une rapide histoire r\u00e9cente (XX<sup>\u00e8me<\/sup> si\u00e8cle)\u00a0; le chapitre 2 pr\u00e9sente les \u00ab\u00a0Fondamentaux de l\u2019apprentissage statistique\u00a0\u00bb\u00a0; puis la validation crois\u00e9e fait l\u2019objet du chapitre 3. Le chapitre 4 traite du risque et du choix de mod\u00e8le en apprentissage, illustr\u00e9 par de nombreux exemples. Et pour terminer, un dernier chapitre aborde une introduction \u00e0 l\u2019optimisation pour l\u2019apprentissage statistique, montrant bien l\u2019int\u00e9r\u00eat de la transversalit\u00e9 et la compl\u00e9mentarit\u00e9 des approches.<\/p>\n<hr \/>\n<p><em>*\u00ab Apprentissage statistique et donn\u00e9es massives \u00bb de\u00a0Myriam Maumy-Bertrand (Ma\u00eetre de Conf\u00e9rences \u00e0 l\u2019Universit\u00e9 de Strasbourg), Gilbert Saporta (Professeur \u00e9m\u00e9rite au CNAM)\u00a0et Christine Thomas-Agnan (Professeure \u00e0 l\u2019universit\u00e9 Toulouse 1), <span style=\"text-decoration: underline; color: #0000ff;\"><a style=\"color: #0000ff; text-decoration: underline;\" href=\"http:\/\/www.editionstechnip.com\/fr\/catalogue-detail\/2268\/apprentissage-statistique-et-donnees-massives.html\">aux \u00e9ditions Technip<\/a><\/span><\/em><\/p>\n","protected":false},"excerpt":{"rendered":"<p>L\u2019arriv\u00e9e du monde num\u00e9rique au milieu des ann\u00e9es 1990, son d\u00e9ploiement dans pratiquement tous les secteurs d\u2019activit\u00e9s et sa vitesse de diffusion aupr\u00e8s des m\u00e9nages dans le monde entier, ont eu pour effet, pour le statisticien, la mise \u00e0 disposition de quantit\u00e9s in\u00e9dites de donn\u00e9es, notamment celles provenant des r\u00e9seaux de communication et du web. [&hellip;]<\/p>\n","protected":false},"author":18,"featured_media":3622,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_et_pb_use_builder":"","_et_pb_old_content":"","_et_gb_content_width":"","_exactmetrics_skip_tracking":false,"_exactmetrics_sitenote_active":false,"_exactmetrics_sitenote_note":"","_exactmetrics_sitenote_category":0,"footnotes":""},"categories":[31],"tags":[],"class_list":["post-3621","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-dans-les-rayons","et-has-post-format-content","et_post_format-et-post-format-standard"],"_links":{"self":[{"href":"https:\/\/variances.eu\/index.php?rest_route=\/wp\/v2\/posts\/3621","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/variances.eu\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/variances.eu\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/variances.eu\/index.php?rest_route=\/wp\/v2\/users\/18"}],"replies":[{"embeddable":true,"href":"https:\/\/variances.eu\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=3621"}],"version-history":[{"count":0,"href":"https:\/\/variances.eu\/index.php?rest_route=\/wp\/v2\/posts\/3621\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/variances.eu\/index.php?rest_route=\/wp\/v2\/media\/3622"}],"wp:attachment":[{"href":"https:\/\/variances.eu\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=3621"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/variances.eu\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=3621"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/variances.eu\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=3621"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}