Introduction : Le contexte de la publication des IPS des collèges

En automne 2022, le Ministère de l’Éducation Nationale et de la Jeunesse a rendu publics deux jeux de données comprenant, le premier pour tous les collèges, et le second pour toutes les classes de CM2, un indicateur du niveau social de l’établissement appelé Indice de Position Sociale (IPS). Cette publication fait suite à un jugement rendu le 13 juillet par le tribunal administratif de Paris, condamnant le ministère à rendre les IPS publics sous un délai de 3 mois[1]. Les médias nationaux se sont rapidement emparés de l’information rendue disponible, pour souligner entre autres la prédominance du privé au sein des établissements les mieux classés du point de vue de l’IPS.

J’ai souhaité à mon tour me pencher sur les données concernant les collèges, pour évoquer deux points permettant de mettre en perspective ce qui peut être lu dans les médias. En premier lieu, il est important de revenir sur les données et la méthode à l’origine de cet indice, afin d’avoir une claire représentation de ce qu’il mesure et de ce qu’il ne mesure pas. Dans un second temps, je présenterai quelques analyses statistiques permettant d’amorcer une réflexion sur les liens unissant le secteur d’un collège, les caractéristiques de la commune sur laquelle il se trouve, et son IPS. Je proposerai en conclusion quelques réflexions sur les conséquences possibles de la diffusion de l’IPS des collèges, qui expliquent d’ailleurs les réticences du ministère à rendre cette information publique en dépit de la législation régissant l’accès aux données administratives, qui l’y a d’ailleurs finalement contraint.

L’IPS d’un établissement, un indicateur doublement synthétique.

Le premier point susceptible de limiter la valeur descriptive de l’IPS tient au fait qu’il peut masquer la diversité et la complexité des situations. Comme cela est précisé dans la note explicative accompagnant les données sur le site du ministère[2], l’IPS d’un établissement scolaire correspond à la moyenne des IPS des élèves fréquentant l’établissement à la rentrée 2021-2022, et n’informe donc pas sur la dispersion des IPS individuels au sein de l’établissement. L’IPS ne peut constituer à lui seul un indicateur fiable de la distance sociale entre deux établissements, puisque derrière des IPS très proches peuvent se cacher des situations très différentes en termes de composition sociale de l’établissement. Inversement, deux établissements aux IPS relativement éloignés peuvent de fait avoir des parts non négligeables de leurs populations respectives de niveau social équivalent.

Cette remarque étant faite, tout l’enjeu de l’interprétation des IPS des établissements repose sur le fait de comprendre comment l’IPS est calculé à l’échelle de l’élève. L’idée de base de l’IPS est d’attribuer à chaque couple de PCS[3] une quantité de référence. L’IPS d’un élève correspond à cette quantité pour le couple formé par la PCS de son père et la PCS de sa mère. Nous noterons au passage que le ministère invite à la vigilance quant à la qualité des données servant de base au calcul de l’IPS ; en effet, les PCS des parents sont déclarées par les élèves, et ne sont donc pas totalement fiables. Les indices associés à chaque PCS correspondent à une combinaison linéaire de caractéristiques bien spécifiques d’un échantillon représentatif d’élèves issus de cette PCS[4] ; c’est pourquoi « cette approche implique […] un modèle sociologique », du fait même du choix des caractéristiques jugées pertinentes pour estimer la valeur d’une catégorie socio-professionnelle. En l’occurrence, le parti pris de l’auteur consiste à prendre en compte des variables qui sont pertinentes pour décrire la distance à l’école des élèves issus d’un couple de PCS donné. Pour plus de détails sur la construction de l’IPS individuel, je renvoie à l’article de Thierry Rocher décrivant extensivement la construction de cet indice[5].

Deux défauts principaux semblent pouvoir limiter la pertinence de cet indice de position sociale à l’échelle individuelle. En premier lieu le fait que sa construction soit profondément dépendante du choix de ces caractéristiques jugées susceptibles de constituer une « médiation » entre l’origine sociale de l’élève et ses performances scolaires. Le second point réside dans le principe même d’attribuer à chaque couple de PCS une valeur unique ; ce choix méthodologique pourrait masquer de potentielles variations dans le rapport à l’école et la propension à la performance scolaire au sein même d’un couple de PCS donné.

Néanmoins, l’IPS permet de récolter, via la PCS, une quantité d’information importante sur la proximité d’un individu au système scolaire, puis de réduire la complexité de cette information à une dimension, pour produire in fine un outil de comparaison efficace et parcimonieux. C’est pourquoi l’IPS d’un collège peut constituer un bon indicateur du niveau social de la population fréquentant l’établissement, à condition de ne pas chercher à lui faire dire davantage que ce qu’il prétend dire. En premier lieu, il importe d’avoir bien à l’esprit que l’IPS n’indique qu’un niveau moyen à l’échelle de l’établissement, et qu’il souffre par conséquent de toutes les limitations qui s’appliquent en général au fait de résumer une série statistique par une moyenne à des fins de comparaison. Une information supplémentaire sur la dispersion des IPS des élèves au sein des établissements apparaîtrait vraiment indispensable pour prétendre à une analyse réellement fine du profil social des collèges français, et mener à des conclusions robustes sur la concentration des élèves les plus dotés socialement dans certains établissements ou certains types d’établissements. En second lieu, il convient de se souvenir que l’IPS constitue, à l’échelle de l’individu, une mesure de la distance à l’école des élèves issus du couple de PCS dont il est issu. L’IPS n’est pas une valeur individuelle, mais est calculé à partir de valeurs de référence, communes à tous les élèves dont le père et la mère exercent le même type de profession. D’autre part, la hiérarchie qu’il permet d’établir entre les PCS dépend d’une conception spécifique des mécanismes reliant origine sociale et performance scolaire, et n’est pas assimilable à d’autres types de hiérarchies basées uniquement sur la détention de capital économique, culturel, symbolique, etc.

L’IPS, déterminé par le secteur ou simple reflet des caractéristiques de la commune ?

Nous l’avons évoqué, nombre des débats ayant suivi la publication de l’IPS des collèges ont porté sur les écarts privé-public. Nos analyses suggèrent qu’en dépit d’une différence de moyenne tout à fait significative entre l’IPS des collèges privés et l’IPS des collèges publics (14 points environ), des parts importantes de l’ensemble de ces deux types d’établissements sont en fait d’IPS moyens (autour de 100). En effet, une grande part des collèges privés sont de niveau social comparable à celui d’une grande part des collèges publics : environ 49 % des collèges publics et environ 42 % des collèges privés ont un IPS compris entre 95 et 115. Comme l’écrivaient en 2015 Son Thierry Ly et Arnaud Riegert[6], « même si les établissements privés accueillent en moyenne un public nettement plus favorisé, les différences entre un établissement favorisé et un établissement défavorisé du même secteur (public ou privé) sont beaucoup plus importantes que les différences entre un établissement moyen public et un établissement moyen privé. » Cela s’explique par le fait que les collèges publics ont des IPS assez concentrés autour d’une valeur moyenne, tandis que les collèges privés sont davantage dispersés (notamment à droite) autour d’une moyenne plus haute, comme cela est visible sur le graphique suivant.

Si donc les différences intra-secteurs sont bien plus importantes que ne le sont les différences inter-secteurs, comment expliquer l’impression extrêmement répandue selon laquelle la segmentation public-privé est responsable d’une grande partie de la concentration des publics les plus favorisés dans certains collèges ?

En premier lieu, il est frappant de constater qu’une importante majorité des collèges les mieux classés en termes d’IPS à l’échelle nationale correspond à des établissements privés. Pour en donner une idée, j’ai tracé la part du privé (en ordonnée) dans les n (en abscisse) premiers collèges français en termes d’IPS à l’échelle nationale, pour n allant de 2 à 200. Afin de contextualiser ce graphique, je précise que sur l’ensemble des collèges présents dans la base, environ un quart (24 %) appartiennent au secteur privé.

On voit donc que le privé est très nettement sur-représenté parmi les collèges aux IPS les plus élevés en moyenne à l’échelle nationale : 95 % des 20 premiers collèges sont privés, 81 % des 100 premiers, 75 % des 200 premiers, 66 % des 500 premiers, etc, quand le secteur privé ne représente que 24 % de l’ensemble des collèges. Néanmoins, on pourrait également penser que ces chiffres ont tant frappé l’opinion publique parce qu’ils permettent d’objectiver à l’échelle nationale une situation dont chacun a l’intuition à l’échelle locale.

À ce titre, Son Thierry Ly et Arnaud Riergert[7] observent que : « Les acteurs de terrain ont le sentiment que la séparation public-privé est la première source de ségrégation sociale entre établissements, parce quelle joue un rôle beaucoup plus important à l’échelle locale. En effet, la segmentation public-privé explique 40 % à 45 % de la ségrégation sociale […] entre les collèges dune même commune. Cela signifie que les différences de composition sociale entre un collège public favorisé et un collège public défavorisé dune même commune sont du même ordre de grandeur que les différences entre un collège public moyen et un collège privé moyen. » En suivant cette ligne de pensée, on peut se demander dans quelle mesure l’écart d’IPS entre privé et public subsiste à l’échelle de la commune, ou entre des communes comparables du point de vue de leur composition sociale et/ou de leur taille.

J’ai donc commencé par regarder le lien entre IPS d’un collège et composition sociale de la commune, en me basant sur des mesures très simples de cette dernière, obtenues via les données du dernier recensement de l’INSEE. Le graphique suivant suggère, par exemple, l’existence d’une association entre IPS d’un collège et part de cadres et professions intellectuelles supérieures (CS3) dans la commune sur laquelle il est situé :

La pente de la droite de régression, tracée en noir, est de 1.27, ce qui signifie qu’à une augmentation de 1 point de pourcentage de la part de cadres et professions intellectuelles supérieures dans une commune correspond en moyenne une augmentation de 1.27 points de l’IPS des collèges qui y sont situés. Le même calcul effectué sur la part de CS6 (ouvriers) donne un coefficient de -1.52. Il semble donc que la valeur de l’IPS d’un collège reflète dans une certaine mesure la composition sociale de la commune sur laquelle il est situé.

Une autre manière de mesurer le lien entre caractéristiques d’une commune et niveau social des collèges qui y sont situés est de regarder dans quelle mesure la variance totale de l’IPS des collèges français est expliquée par des variations inter-communes davantage que par des variations intra-communes. J’ai trouvé à ce titre que 24.8 % de la variance totale de l’IPS provient d’une variation du niveau moyen de l’IPS entre les communes, ce qui confirme bien la pertinence du niveau commune comme facteur de variation de l’IPS[8]. Au niveau des communes, on retrouve bien une association entre parts de différentes catégories socioprofessionnelles et niveau moyen de l’IPS des collèges situés sur cette commune : 1.52 pour la CS3 (cadres et professions intellectuelles supérieures) et  -1.34 pour la CS6 (ouvriers).

Pour donner une idée du point auquel les collèges sont socialement homogènes au sein d’une même commune, je me suis intéressée (pour les communes ayant plus de deux collèges) à la variance intra-commune de l’IPS des collèges, laquelle peut constituer une mesure de l’hétérogénéité sociale des collèges au sein d’une commune.  De premières analyses suggèrent qu’il y aurait une association positive entre la composition sociale de la commune et l’hétérogénéité entre collèges de la commune, et ce même en contrôlant par la taille de la commune. J’ai également regardé comment la variance intra-commune de l’IPS varie en fonction de la présence ou non d’au moins un collège privé au sein de la commune : on trouve que l’hétérogénéité sociale des collèges au sein des communes regroupant plus de deux collèges est significativement plus importante lorsqu’au moins un de ces collèges est privé par rapport au cas où tous les collèges sont publics. Ici aussi, l’effet observé subsiste même en contrôlant par la taille de la commune.

Conclusion – Publier ou ne pas publier les IPS ?

Les données sur les IPS des collèges, publiées par le ministère cet automne, permettent, en dépit des différentes limitations qui les affectent, d’objectiver un certain nombre d’intuitions spontanées concernant la manière dont des élèves que leur position sociale rend plus ou moins susceptibles de réussir au sein du système scolaire – car c’est bien ce qu’a vocation à mesurer in fine l’IPS – se répartissent dans les établissements du second degré. J’ai notamment voulu commencer à montrer que, si l’appartenance à une commune donnée ou à un type de commune du point de vue de la composition sociale explique une part de la variation des IPS à l’échelle nationale, il subsiste des variations substantielles entre collèges d’une même commune, qui semblent plus importantes lorsque l’un de ces collèges appartient au secteur privé. Bien sûr, ces résultats préliminaires gagneront à être détaillés et testés plus rigoureusement, notamment dans la mesure où les variables utilisées peuvent sembler insuffisantes pour décrire avec précision le contexte local. Il serait par exemple nécessaire de prendre en compte les effets du découpage de la carte scolaire, ou encore la situation des communes dans des aires urbaines plus ou moins denses, que ne suffit pas à résumer le nombre d’habitants de la commune. Il me semblait néanmoins utile de suggérer par ces analyses à quel point la publication de ces données, aussi partielles soient-elles, peut être fructueuse pour l’analyse de la ségrégation sociale dans les établissements scolaires, notamment lorsqu’elles sont croisées avec d’autres données.

Un argument important qui a joué en faveur de la publication de ces données est qu’elles ne permettent pas seulement une meilleure connaissance du système scolaire français, mais apportent également une information sur la façon dont il est géré par le ministère. En effet, les IPS des collèges sont concrètement utilisés par le ministère à des fins d’allocation de subventions ou de répartition des effectifs scolaires. L’IPS est en particulier l’instrument qui permet de caractériser la situation sociale d’un collège, et donc d’attribuer ou non des points bonus dans Affelnet (pour la ville de Paris)[9] aux élèves qui en sont issus. On comprend que l’enjeu politique autour de ces données soit extrêmement important ; si certains exigent la transparence du ministère quant aux instruments dont il fait usage pour catégoriser et répartir les élèves, d’autres alertent sur des effets potentiellement négatifs de la diffusion de ces données. En effet, comme l’a montré Lorenzo Barrault-Stella[10], les stratégies familiales visant à contourner la carte scolaire pour scolariser ses enfants dans des établissements mieux réputés socialement et scolairement sont nombreuses et souvent efficaces. Fabienne Rosenwald, directrice de la DEPP déclarait à ce titre dans le journal News Tank[11] : Nous navions pas mis en ligne les données dIPS (Indice de position sociale), car elles pouvaient stigmatiser les établissements, qui évidemment, pour une majorité dentre eux, ne choisissent pas leurs publics. Et lon sait bien qu’il  y a des établissements très ségrégués. Je note que les analyses qui sont faites des données dans la presse recoupent ce quon avait pu écrire dans dautres travaux, comme sur les indices de mixité sociale, mais aussi ce qui a conduit aux indicateurs de valeur ajoutée. Ces derniers me semblent bien plus pertinents, puisqu’ils donnent une information aux familles, tandis que lIPS ne dit rien sur laction des établissements.” On peut chercher à anticiper les conséquences de la mise à disposition d’une information sur le niveau social des collèges sur ces stratégies pour des familles désireuses et capables d’exploiter l’information : soit un recours accru au privé des familles ne jugeant pas suffisant le niveau social de leur collège de quartier, soit un accroissement de stratégies de contournement (par le truchement, par exemple, du choix d’options ou de filières spécifiques) pour être affectés dans un collège jugé préférable au collège de quartier. Mais on pourrait anticiper à l’inverse que, pour la ville de Paris, certaines familles bien classées du point de vue de l’IPS accepteront plus facilement de scolariser leurs enfants dans leur collège de quartier dans le cas où elles seraient en mesure d’anticiper que cela leur apportera un bonus pour intégrer des lycées prestigieux. Il est donc légitime de penser que la publication de ces données (suivie plus récemment de la publication des IPS des lycées) pourrait avoir, à terme, un effet non négligeable sur la ségrégation scolaire et l’évolution de la mixité sociale au sein des établissements du second degré, sans qu’il soit pour l’instant tout à fait possible d’anticiper le sens de ces effets.

 

NB : Je tiens à remercier Caroline Pinton qui a grandement contribué à cette réflexion par sa relecture attentive.


[1] https://www.lemonde.fr/societe/article/2022/07/15/l-education-nationale-condamnee-a-reveler-l-indice-de-position-sociale-des-colleges-et-des-cm2_6134916_3224.html

[2] https://data.education.gouv.fr/explore/dataset/fr-en ips_colleges/information/?disjunctive.rentree_scolaire&disjunctive.academie&disjunctive.code_du_departement&disjunctive.departement&disjunctive.uai&disjunctive.code_insee_de_la_commune&disjunctive.nom_de_la_commune&disjunctive.secteur

[3] Profession et Catégorie Socioprofessionnelle, selon des modalités propres à l’Éducation Nationale, qui mélangent deux niveaux des nomenclatures de l’INSEE.

[4] Plus précisément, l’auteur effectue, sur les données du panel 2006 de la DEPP, une Analyse des Correspondances Multiples (ACM) de l’ensemble des variables retenues, et prend pour indice pour chaque PCS la projection de cette PCS sur la première composante. Ainsi, « le poids d’une variable dans la combinaison linéaire est déterminé par l’inertie qu’elle représente parmi l’ensemble des variables retenues. »

[5] Thierry Rocher. Construction d’un indice de position sociale des élèves. Éducation & formations, DEPP, 2016, 90, pp.5-27.

[6] Son Thierry Ly et Arnaud Riegert. Mixité sociale et scolaire et ségrégation inter- et intra-établissement dans les collèges et lycées français. Rapport au Conseil National d’évaluation du système scolaire. 2015.

[7] Son Thierry Ly et Arnaud Riegert. Mixité sociale et scolaire et ségrégation inter- et intra-établissement dans les collèges et lycées français. Rapport au Conseil National d’évaluation du système scolaire. 2015.

[8] Néanmoins, ce chiffre est trouvé en utilisant la classification des communes telle qu’elle est donnée sur le site du ministère, qui considère notamment les arrondissements parisiens, marseillais et lyonnais comme des communes à part entière. En regroupant artificiellement les arrondissements de ces trois villes au sein de trois communes, on trouve que la variance inter-communes de l’IPS ne vaut plus que 19.6 % de la variance totale, ce qui est logique puisque ce changement fait à la fois diminuer la variance inter-communes (qui passe de 64.9 à 50.9) et augmenter la variance intra-communes (qui passe de 196.7 à 209.2).

[9] Affelnet est un logiciel de l’Éducation Nationale qui affecte algorithmiquement les collégiens à des lycées en fonction de leurs vœux et d’un certain nombre de leurs caractéristiques scolaires, mais aussi des caractéristiques sociales de l’établissement dont ils sont issus.

[10] Lorenzo Barrault, Gouverner par accommodements. La régulation publique de laccès à l’École et les stratégies des familles, thèse pour le doctorat de science politique, Université Paris 1, 2011

[11] News Tank « Être indépendant ne signifie pas être hors-sol » : les enjeux et projets de la Depp, Interview de F. Rosenwald, 23/01/2023