Le sujet « statistiques ethniques » revient frĂ©quemment dans le dĂ©bat public, souvent de façon passionnĂ©e. On mentionnera d’abord que l’ethnie, Ă©tymologiquement, est polysĂ©mique, ce qui favorise les malentendus. Le terme renvoie Ă  la race, aux origines ou encore Ă  des identitĂ©s partagĂ©es. Il en dĂ©coule que la notion de statistique ethnique recouvre un recueil d’informations trĂšs disparate. Au-delĂ  de querelles de vocabulaire, les diffĂ©rentes catĂ©gories de statistiques ethniques peuvent apporter des informations pertinentes, mais, comme toutes statistiques, doivent ĂȘtre employĂ©es avec discernement.

Les statistiques ethniques recouvrent un ensemble trùs 
 divers

Les statistiques ethniques recouvrent principalement deux grands types d’informations susceptibles d’ĂȘtre collectĂ©es en statistiques. Un premier groupe rassemblerait des informations relatives Ă  la religion, l’origine plus culturelle que gĂ©ographique, et 
 Ă  l’ethnie. Le second groupe relĂšve de tout ce qui se rapporte au lieu de naissance, Ă  la nationalitĂ© de naissance, de l’individu, voire de ses parents (et au-delĂ  
). Le premier groupe de donnĂ©es pose des problĂšmes majeurs en termes de statistiques : il n’existe pas de nomenclature en matiĂšre de religion, ou de « race ». Se cumulent donc des difficultĂ©s conceptuelles (qu’est-ce qu’une ethnie ?) et opĂ©ratoires (quelles nomenclatures appliquer ?). En revanche, le second groupe permet une catĂ©gorisation trĂšs dĂ©taillĂ©e en croisant nationalitĂ© et lieu de naissance, d’oĂč une grande finesse des analyses, basĂ©es sur des caractĂ©ristiques objectives et mesurables. L’Insee a encore recueilli un ensemble d’information structurĂ© dans un cadre conceptuel d’identitĂ© (familial, transmission de caractĂšres identitaires comme le prĂ©nom, linguistique, 
), qui relĂšvent de statistiques dans un troisiĂšme sens du mot « ethnique ».

L’approche communautaire ou sociale : les statistiques ethniques se dĂ©clinent selon le contexte

Des statistiques du premier type sont collectĂ©es dans trĂšs peu de pays. Mais parmi les pays oĂč elles le sont figurent les Etats-Unis et le Royaume-Uni. LĂ , un recueil d’une information sur « la race » est frĂ©quent. ChĂŽmage et espĂ©rance de vie peuvent ĂȘtre dĂ©clinĂ©s par couleur de peau, de mĂȘme que la prĂ©valence des sĂ©jours en prison. Les statistiques du second groupe sont au contraire frĂ©quemment recueillies, dans la plupart des pays d’Europe, au moins quand il s’agit des informations relatives Ă  l’individu. Elles sont facilement croisĂ©es avec des donnĂ©es sociales. Statistiques et rĂ©cit national ne sont pas disjoints : ici, les trajectoires des individus seront davantage lues suivant une grille communautaire, lĂ , les dĂ©terminants  sociaux seront privilĂ©giĂ©s.

La France collecte un ensemble de statistiques ethniques trÚs détaillé

Le recensement français (qui est une enquĂȘte complexe et de taille considĂ©rable) recueille le lieu et la nationalitĂ© de naissance des individus. Il permet des analyses d’une prĂ©cision remarquable. Les fichiers administratifs sont exhaustifs. Souvent, Ă©trangers et non Ă©trangers seront distinguĂ©s dans ces fichiers.  Cette masse Ă©norme d’informations est disponible. Elle permet d’analyser les comportements socio-Ă©conomiques des Ă©trangers et immigrĂ©s. L’appareil statistique d’Etat (pardon pour la redondance) a depuis une quinzaine d’annĂ©es multipliĂ© les enquĂȘtes « ethniques » ! Cela signifie plus trivialement que ces enquĂȘtes comprennent les questions utiles pour identifier les immigrĂ©s et les personnes ayant au moins un parent immigrĂ©. Ainsi, rien n’est inconnu concernant l’emploi, l’éducation, le logement, les conditions de revenus et de vie, le capital culturel, 
, des immigrĂ©s et de leurs descendants. Limite importante mais fondamentale dans les dĂ©bats, ces statistiques dĂ©clinĂ©es par nationalitĂ© et lieu de naissance produisent des analyses subtiles mais Ă  l’échelle du pays tout en entier. En revanche de telles analyses ne sont pas disponibles Ă  des Ă©chelons infra–nationaux.

Quantité ou qualité, pas de dessert pour ceux qui prennent le fromage

Les enquĂȘtes par sondage ont le dĂ©faut de la non-exhaustivitĂ©, mais de nombreux avantages en termes de qualitĂ© et de richesse de l’information disponible. Les donnĂ©es de recensements et de rĂ©pertoires administratifs, par contraste, sont de qualitĂ© moindre. Outre ces dĂ©fauts techniques, les recensements et rĂ©pertoires ont « le dĂ©faut de leur qualité » : ils sont exhaustifs (ou presque). Ainsi, par nature, ils constituent une intrusion de l’Etat dans la vie privĂ©e des personnes, en donnant accĂšs Ă  leurs caractĂ©ristiques individuelles.

Les statistiques ethniques sont formellement interdites 
 sauf exception (on est en France, aprùs tout 
)

De vifs dĂ©bats sur les statistiques ethniques se sont tenus au milieu des annĂ©es 2000. La prise de conscience qu’une population « de deuxiĂšme gĂ©nĂ©ration » de plus en plus importante vivait en France, qu’elle Ă©tait mal connue, et que les dĂ©bats sur l’intĂ©gration se dĂ©veloppaient, contextualise ce moment de conflit. Un comitĂ© pour la mesure de la diversitĂ© et l’Ă©valuation des discriminations (Comedd) siĂ©gea et statua, aussitĂŽt contestĂ© par un contre-comitĂ©, tandis que le Conseil constitutionnel rendait de façon cavaliĂšre (incidente serait plus prĂ©cis) une dĂ©cision sur un cavalier lĂ©gislatif visant Ă  autoriser 
 des statistiques ethniques. En conclusion, les statistiques ethniques ne sont pas interdites, mais le recueil de celles-ci se fera au cas par cas et devra ĂȘtre dĂ»ment motivĂ©. Dans ce contexte, l’enquĂȘte de l’Ined et de l’Insee, « Trajectoires et Origines », (TeO), put avoir lieu en 2008, apportant une mine d’information sur les immigrĂ©s, les descendants, leurs conditions de vie, leurs 
 religions et d’autres caractĂ©ristiques identitaires.

Les statistiques ethniques non exhaustives apportent une information surabondante 


Le succĂšs de TeO en relation avec d’autres travaux quantifiant les discriminations dont sont victimes les personnes d’origine Ă©trangĂšre semble justifier la force des statistiques pour l’épiphanie des besoins en information, dans une perspective d’action publique. Plus encore, toute l’information statistique concernant les immigrĂ©s et les descendants d‘immigrĂ©s, cartographiĂ©e dans la foulĂ©e de TeO, a Ă©tĂ© mobilisĂ©e dans deux ouvrages de synthĂšse. Le premier, publiĂ© en 2012 par l’Insee, reste la rĂ©fĂ©rence française pour dĂ©crire les conditions socioĂ©conomiques des immigrĂ©s et des descendants d’immigrĂ©s. Le second, publiĂ© en 2016 par l’Ined, conforte et complĂšte les analyses dĂ©jĂ  faites, et documente les discriminations dont sont victimes les immigrĂ©s et descendants d’immigrĂ©s. Cette cartographie a aussi permis de voir ce qui pouvait se faire, mais qui n’avait pas pu l’ĂȘtre (il faut des donnĂ©es, il faut aussi des gens pour les exploiter !) et 
 ce qui manquait.  En particulier, les donnĂ©es de TeO sont loin d’avoir rendu toute leur substantifique moelle.


.mais malgré tout incomplÚte

Des techniques statistiques apportent des rĂ©sultats complĂ©mentaires utiles. Essentiellement, il s’agit de mettre en relation des caractĂ©ristiques individuelles avec des caractĂ©ristiques de contexte. Celles-ci sont par exemple, par quartier, le revenu fiscal mĂ©dian, ou le nombre de mĂ©decins, ou encore la distance au transport en commun le plus proche. Ces techniques apportent des prĂ©cisions souvent suffisantes pour documenter les situations socioĂ©conomiques des personnes confrontĂ©es Ă  des situations locales particuliĂšres, sans qu’il soit besoin de prĂ©ciser leur implantation gĂ©ographique prĂ©cise. On Ă©vite ainsi le risque de les  identifier. Ces mĂ©thodes sont de plus en plus utilisĂ©es pour cadrer les politiques de la Ville et sont relativement peu coĂ»teuses.

Les statistiques ethniques exhaustives sont potentiellement utiles, 


Toutefois, une connaissance locale prĂ©cise des conditions de vie ne peut rĂ©sulter que d’outils comme le recensement ou les registres administratifs. Cette connaissance des conditions locales est utile, et permettrait d’ajuster les besoins puis de mesurer finement l’efficacitĂ© des mesures prises. On relĂšvera ici que le statisticien doit rester modeste : les dĂ©cideurs, ainsi bien locaux que nationaux, n’intĂšgrent le plus souvent que trĂšs peu les analyses statistiques pour dĂ©finir et mettre en Ɠuvre leurs politiques, au moins dans le domaine de l’immigration et de l’intĂ©gration. Toujours est-il que rajouter des questions « ethniques », telles que les lieux et nationalitĂ©s des parents dans le recensement, est possible, mais en revanche techniquement coĂ»teux. Il convient donc d’estimer les coĂ»ts et avantages d’un dĂ©veloppement de ces statistiques, dĂ©clinĂ©es non plus dans des enquĂȘtes (oĂč l’information recueillie permet les analyses sociodĂ©mographiques) mais au niveau individuel et local (ce qui permet d’affiner les analyses). En termes d’avantages, rappelons la devise de l’Insee : « mesurer pour comprendre ». Une connaissance statistique participe au fondement des politiques pertinentes, mais ce n’est pas au statisticien de les dĂ©finir et de les mettre en Ɠuvre. A rebours, le politique, reprĂ©sentant du peuple français, devra rĂ©clamer (et impulser) la collecte des statistiques utiles Ă  l’action qu’il mĂšne.


 mais elles ne sont pas sans inconvénients

Quels sont les inconvĂ©nients d’un recensement incluant les questions « ethniques », au sens des origines ? Ils sont au moins de trois ordres. D’abord l’illusion de la prĂ©cision de ces statistiques dĂ©clinĂ©es sur un plan trĂšs local peut paradoxalement favoriser des interprĂ©tations des Ă©carts de situations simplificatrices ou erronĂ©es. Ces Ă©carts de situations (par exemple le taux de chĂŽmage), aprĂšs contrĂŽles par une sĂ©rie de facteurs sociodĂ©mographiques, seront « expliquĂ©s » principalement par l’origine. Rappelons ici que deux « explications » polaires sont possibles et, hĂ©las, aussi frĂ©quentes que rĂ©ductrices dans le dĂ©bat public. Soit la propension au chĂŽmage est un facteur « culturel », soit ce chĂŽmage relĂšve d’une discrimination non plus au sens statistique mais juridique. Dans les deux cas on attribue des Ă©carts non expliquĂ©s Ă  une cause unique et sera violĂ©e une rĂšgle de la statistique qui est de ne pas ajouter l’arrogance Ă  l’ignorance. Ensuite, la conception mĂȘme de la citoyennetĂ© française ne peut s’accommoder d’un renvoi constant aux circonstances des aĂŻeux. Notre Constitution et nos lois ne prĂ©voient pas de  Français « à l’essai », d’autant que cette pĂ©riode d’essai s’étendrait sur plusieurs gĂ©nĂ©rations, en cohĂ©rence avec un recueil statistique d’origines lointaines. Enfin, la statistique est par dĂ©finition une intrusion de l’Etat dans la vie privĂ©e des personnes. Le compromis français, fondĂ© sur des enquĂȘtes par sondage, de grande qualitĂ© mais non exhaustives, a jusqu’à prĂ©sent conciliĂ© le besoin d’information et le respect de l’anonymat des citoyens. Ce respect de l’anonymat devient de plus en plus difficile Ă  rĂ©aliser au vu des facilitĂ©s techniques de recueil et traitement de l’information, d’autant que l’on introduirait des informations sur les origines non plus dans une enquĂȘte mais dans un recensement. Trois risques qu’il n’est pas interdit de prendre, mais avec mesure et en connaissance de cause