Le sujet « statistiques ethniques » revient fréquemment dans le débat public, souvent de façon passionnée. On mentionnera d’abord que l’ethnie, étymologiquement, est polysémique, ce qui favorise les malentendus. Le terme renvoie à la race, aux origines ou encore à des identités partagées. Il en découle que la notion de statistique ethnique recouvre un recueil d’informations très disparate. Au-delà de querelles de vocabulaire, les différentes catégories de statistiques ethniques peuvent apporter des informations pertinentes, mais, comme toutes statistiques, doivent être employées avec discernement.

Les statistiques ethniques recouvrent un ensemble très … divers

Les statistiques ethniques recouvrent principalement deux grands types d’informations susceptibles d’être collectées en statistiques. Un premier groupe rassemblerait des informations relatives à la religion, l’origine plus culturelle que géographique, et … à l’ethnie. Le second groupe relève de tout ce qui se rapporte au lieu de naissance, à la nationalité de naissance, de l’individu, voire de ses parents (et au-delà …). Le premier groupe de données pose des problèmes majeurs en termes de statistiques : il n’existe pas de nomenclature en matière de religion, ou de « race ». Se cumulent donc des difficultés conceptuelles (qu’est-ce qu’une ethnie ?) et opératoires (quelles nomenclatures appliquer ?). En revanche, le second groupe permet une catégorisation très détaillée en croisant nationalité et lieu de naissance, d’où une grande finesse des analyses, basées sur des caractéristiques objectives et mesurables. L’Insee a encore recueilli un ensemble d’information structuré dans un cadre conceptuel d’identité (familial, transmission de caractères identitaires comme le prénom, linguistique, …), qui relèvent de statistiques dans un troisième sens du mot « ethnique ».

L’approche communautaire ou sociale : les statistiques ethniques se déclinent selon le contexte

Des statistiques du premier type sont collectées dans très peu de pays. Mais parmi les pays où elles le sont figurent les Etats-Unis et le Royaume-Uni. Là, un recueil d’une information sur « la race » est fréquent. Chômage et espérance de vie peuvent être déclinés par couleur de peau, de même que la prévalence des séjours en prison. Les statistiques du second groupe sont au contraire fréquemment recueillies, dans la plupart des pays d’Europe, au moins quand il s’agit des informations relatives à l’individu. Elles sont facilement croisées avec des données sociales. Statistiques et récit national ne sont pas disjoints : ici, les trajectoires des individus seront davantage lues suivant une grille communautaire, là, les déterminants  sociaux seront privilégiés.

La France collecte un ensemble de statistiques ethniques très détaillé

Le recensement français (qui est une enquête complexe et de taille considérable) recueille le lieu et la nationalité de naissance des individus. Il permet des analyses d’une précision remarquable. Les fichiers administratifs sont exhaustifs. Souvent, étrangers et non étrangers seront distingués dans ces fichiers.  Cette masse énorme d’informations est disponible. Elle permet d’analyser les comportements socio-économiques des étrangers et immigrés. L’appareil statistique d’Etat (pardon pour la redondance) a depuis une quinzaine d’années multiplié les enquêtes « ethniques » ! Cela signifie plus trivialement que ces enquêtes comprennent les questions utiles pour identifier les immigrés et les personnes ayant au moins un parent immigré. Ainsi, rien n’est inconnu concernant l’emploi, l’éducation, le logement, les conditions de revenus et de vie, le capital culturel, …, des immigrés et de leurs descendants. Limite importante mais fondamentale dans les débats, ces statistiques déclinées par nationalité et lieu de naissance produisent des analyses subtiles mais à l’échelle du pays tout en entier. En revanche de telles analyses ne sont pas disponibles à des échelons infra–nationaux.

Quantité ou qualité, pas de dessert pour ceux qui prennent le fromage

Les enquêtes par sondage ont le défaut de la non-exhaustivité, mais de nombreux avantages en termes de qualité et de richesse de l’information disponible. Les données de recensements et de répertoires administratifs, par contraste, sont de qualité moindre. Outre ces défauts techniques, les recensements et répertoires ont « le défaut de leur qualité » : ils sont exhaustifs (ou presque). Ainsi, par nature, ils constituent une intrusion de l’Etat dans la vie privée des personnes, en donnant accès à leurs caractéristiques individuelles.

Les statistiques ethniques sont formellement interdites … sauf exception (on est en France, après tout …)

De vifs débats sur les statistiques ethniques se sont tenus au milieu des années 2000. La prise de conscience qu’une population « de deuxième génération » de plus en plus importante vivait en France, qu’elle était mal connue, et que les débats sur l’intégration se développaient, contextualise ce moment de conflit. Un comité pour la mesure de la diversité et l’évaluation des discriminations (Comedd) siégea et statua, aussitôt contesté par un contre-comité, tandis que le Conseil constitutionnel rendait de façon cavalière (incidente serait plus précis) une décision sur un cavalier législatif visant à autoriser … des statistiques ethniques. En conclusion, les statistiques ethniques ne sont pas interdites, mais le recueil de celles-ci se fera au cas par cas et devra être dûment motivé. Dans ce contexte, l’enquête de l’Ined et de l’Insee, « Trajectoires et Origines », (TeO), put avoir lieu en 2008, apportant une mine d’information sur les immigrés, les descendants, leurs conditions de vie, leurs … religions et d’autres caractéristiques identitaires.

Les statistiques ethniques non exhaustives apportent une information surabondante …

Le succès de TeO en relation avec d’autres travaux quantifiant les discriminations dont sont victimes les personnes d’origine étrangère semble justifier la force des statistiques pour l’épiphanie des besoins en information, dans une perspective d’action publique. Plus encore, toute l’information statistique concernant les immigrés et les descendants d‘immigrés, cartographiée dans la foulée de TeO, a été mobilisée dans deux ouvrages de synthèse. Le premier, publié en 2012 par l’Insee, reste la référence française pour décrire les conditions socioéconomiques des immigrés et des descendants d’immigrés. Le second, publié en 2016 par l’Ined, conforte et complète les analyses déjà faites, et documente les discriminations dont sont victimes les immigrés et descendants d’immigrés. Cette cartographie a aussi permis de voir ce qui pouvait se faire, mais qui n’avait pas pu l’être (il faut des données, il faut aussi des gens pour les exploiter !) et … ce qui manquait.  En particulier, les données de TeO sont loin d’avoir rendu toute leur substantifique moelle.

….mais malgré tout incomplète

Des techniques statistiques apportent des résultats complémentaires utiles. Essentiellement, il s’agit de mettre en relation des caractéristiques individuelles avec des caractéristiques de contexte. Celles-ci sont par exemple, par quartier, le revenu fiscal médian, ou le nombre de médecins, ou encore la distance au transport en commun le plus proche. Ces techniques apportent des précisions souvent suffisantes pour documenter les situations socioéconomiques des personnes confrontées à des situations locales particulières, sans qu’il soit besoin de préciser leur implantation géographique précise. On évite ainsi le risque de les  identifier. Ces méthodes sont de plus en plus utilisées pour cadrer les politiques de la Ville et sont relativement peu coûteuses.

Les statistiques ethniques exhaustives sont potentiellement utiles, …

Toutefois, une connaissance locale précise des conditions de vie ne peut résulter que d’outils comme le recensement ou les registres administratifs. Cette connaissance des conditions locales est utile, et permettrait d’ajuster les besoins puis de mesurer finement l’efficacité des mesures prises. On relèvera ici que le statisticien doit rester modeste : les décideurs, ainsi bien locaux que nationaux, n’intègrent le plus souvent que très peu les analyses statistiques pour définir et mettre en œuvre leurs politiques, au moins dans le domaine de l’immigration et de l’intégration. Toujours est-il que rajouter des questions « ethniques », telles que les lieux et nationalités des parents dans le recensement, est possible, mais en revanche techniquement coûteux. Il convient donc d’estimer les coûts et avantages d’un développement de ces statistiques, déclinées non plus dans des enquêtes (où l’information recueillie permet les analyses sociodémographiques) mais au niveau individuel et local (ce qui permet d’affiner les analyses). En termes d’avantages, rappelons la devise de l’Insee : « mesurer pour comprendre ». Une connaissance statistique participe au fondement des politiques pertinentes, mais ce n’est pas au statisticien de les définir et de les mettre en œuvre. A rebours, le politique, représentant du peuple français, devra réclamer (et impulser) la collecte des statistiques utiles à l’action qu’il mène.

… mais elles ne sont pas sans inconvénients

Quels sont les inconvénients d’un recensement incluant les questions « ethniques », au sens des origines ? Ils sont au moins de trois ordres. D’abord l’illusion de la précision de ces statistiques déclinées sur un plan très local peut paradoxalement favoriser des interprétations des écarts de situations simplificatrices ou erronées. Ces écarts de situations (par exemple le taux de chômage), après contrôles par une série de facteurs sociodémographiques, seront « expliqués » principalement par l’origine. Rappelons ici que deux « explications » polaires sont possibles et, hélas, aussi fréquentes que réductrices dans le débat public. Soit la propension au chômage est un facteur « culturel », soit ce chômage relève d’une discrimination non plus au sens statistique mais juridique. Dans les deux cas on attribue des écarts non expliqués à une cause unique et sera violée une règle de la statistique qui est de ne pas ajouter l’arrogance à l’ignorance. Ensuite, la conception même de la citoyenneté française ne peut s’accommoder d’un renvoi constant aux circonstances des aïeux. Notre Constitution et nos lois ne prévoient pas de  Français « à l’essai », d’autant que cette période d’essai s’étendrait sur plusieurs générations, en cohérence avec un recueil statistique d’origines lointaines. Enfin, la statistique est par définition une intrusion de l’Etat dans la vie privée des personnes. Le compromis français, fondé sur des enquêtes par sondage, de grande qualité mais non exhaustives, a jusqu’à présent concilié le besoin d’information et le respect de l’anonymat des citoyens. Ce respect de l’anonymat devient de plus en plus difficile à réaliser au vu des facilités techniques de recueil et traitement de l’information, d’autant que l’on introduirait des informations sur les origines non plus dans une enquête mais dans un recensement. Trois risques qu’il n’est pas interdit de prendre, mais avec mesure et en connaissance de cause …