Difficile aujourd’hui d’échapper aux articles évoquant l’introduction du Big Data dans toutes les sphères de la société (santé, industrie…). Parmi ces sphères, l’entreprise, et dans l’entreprise, le domaine des Ressources Humaines. Les promesses sont nombreuses : fidélisation des salariés, amélioration de la qualité du recrutement, personnalisation des services aux salariés… Ainsi, le site Glassdoor a mis le « Big Data » dans les 5 grandes tendances RH de 2017[1] ; dans un article publié sur un blog de La Tribune, les promesses du Big Data RH sont présentées comme très nombreuses : anticiper les besoins en compétences, identifier les leviers d’engagement, améliorer le recrutement, réduire le turnover, fidéliser les talents… Aujourd’hui, les articles médiatiques semblent encore prendre peu de recul sur le phénomène du Big Data[2] et sur la liste des promesses associées.

Difficilement également d’échapper au terme de « data scientist » quand on évoque le Big Data. Le data scientist, ce détenteur du savoir en termes d’analyse de données, est ainsi censé savoir exactement quoi faire avec les données. Il est parfois vu et présenté comme un « magicien » qui sortira d’un amas de données des résultats, des plans d’action …

Or, le sujet traité est avant tout un sujet de Ressources Humaines : que l’on parle de fidélisation, de recrutement, de formation, de mobilité, on reste dans le domaine RH, et ce sont les acteurs RH qui détiennent le savoir lié au métier. Un projet Big Data RH doit donc être conduit en partenariat entre les data scientists et les équipes RH.

Au-delà du métier se pose la question de l’éthique. N’oublions pas que le Big Data RH conduit à manipuler des données personnelles des salariés potentiellement extrêmement sensibles (le salaire, pour n’en citer qu’une). De plus, si le Big Data RH conduit à des plans d’action et à une prise de décision, il faut bien s’assurer que ces décisions ne contreviennent pas aux règles éthiques et morales, essentielles en RH, qu’il s’agisse de recrutement, d’évaluation des salariés, de promotion, de gestion de l’absentéisme, etc.

Plus précisément, la question de l’éthique se pose à trois moments du processus :

  • quand on passe d’un ensemble très important de données à un ensemble de variables sélectionnées,
  • quand on passe des données sélectionnées à des résultats fournis par un algorithme ou une analyse,
  • et quand on passe de ces résultats à un plan d’action.

Ces trois moments essentiels des projets Big Data RH nécessitent une réflexion approfondie, réunissant les data scientists, mais aussi les RH et les juristes, sur les dimensions éthiques (cf. schéma). Il faut pouvoir répondre à des questions du type : pourquoi sélectionner ces variables-ci ? quel rapport ont-elles avec le sujet ? comment les données sont-elles utilisées par l’analyse ou l’algorithme ? le plan d’action que je définis suite à l’analyse produite est-il respectueux de l’équité, de la diversité, de la vie privée ?

imagecc

Pour concrétiser ces propos, on peut donner un exemple pour chaque étape.

  1. Au moment de la sélection des variables : il faut s’assurer que les variables sélectionnées répondent bien au but initial de l’analyse. Par exemple, est-il pertinent et éthique de sélectionner la variable « état de santé » pour un recrutement ? Est-il pertinent et éthique de sélectionner la variable « nombre d’enfants » pour une évaluation ou une promotion ? Ces deux questions conduisant à une réponse négative, il ne faut pas sélectionner ces variables sur ces thématiques. En revanche, sélectionner la variable « état de santé » peut être pertinent dans le cas d’une étude sur l’absentéisme, et sélectionner la variable « nombre d’enfants » peut être pertinent dans une étude sur l’écart de salaire, où par exemple, on voudrait mesurer l’impact du nombre d’enfants sur le salaire selon le sexe, toutes choses égales par ailleurs.
  2. Au moment de l’analyse ou de la production de l’algorithme : il faut s’assurer de la manière dont on mobilise les variables dans l’analyse. Par exemple, quel que soit le sujet, mobiliser la variable « genre » dans une analyse ou un algorithme peut répondre à plusieurs enjeux, dont celui de contrôler un éventuel biais, mais il faut bien garder à l’esprit qu’introduire cette variable peut conduire à reproduire des biais. Ainsi, si on considère que le genre est une variable explicative des formations suivies, on risque de reproduire un biais genré conduisant à une ségrégation genrée des formations suivies quand on va vouloir recommander des formations en fonction des caractéristiques de la personne, dont le genre ; en revanche, si on souhaite faire en sorte que des recommandations de formations ne comportent pas de biais genré, on peut utiliser la variable « genre » pour contrôler ce biais.
  3. Au moment du plan d’action : il faut s’assurer du caractère éthique de ce plan d’action. Ainsi, si une étude sur l’absentéisme a montré que les femmes avec des enfants en bas âge ont une plus forte probabilité d’être absentes que les femmes sans enfants en bas âge, on peut faire en sorte d’équilibrer les responsabilités familiales, notamment de gardes d’enfants malades, pesant sur les femmes ou les hommes, prévoir des solutions de télétravail… Et non éviter de recruter des femmes avec des enfants en bas âge !

On voit donc qu’à chaque étape du processus, il faut se poser la question de l’éthique pour s’assurer que l’usage du Big Data RH ne conduira pas aux dérives que craignent parfois les salariés, ou les citoyens dans le cas du Big Data plus largement.

Pour finir, on peut insister sur le fait que l’éthique ne réside pas dans les données, ni dans les méthodes d’analyse des données : l’éthique réside dans la façon dont on mobilise les variables et dans ce qu’on fait des résultats. C’est là que les acteurs RH doivent se mobiliser, conjointement avec les data scientists, pour garantir que l’introduction du Big Data en RH respectera les engagements fondamentaux de la fonction RH.


[1] http://e-rse.net/5-tendances-rh-ressources-humaines-2017-23855/

[2] Certains articles évoquent quand même la limite de la qualité des données, par exemple.  Voir par exemple http://www.usine-digitale.fr/article/cinq-questions-a-se-poser-avant-d-utiliser-le-big-data-dans-les-rh.N385412

Clotilde Coron