La hausse de l’inflation a remis sur le devant de la scène une statistique à laquelle se sont consacrées plusieurs générations d’anciens élèves de l’Ensae : l’indice des prix à la consommation (IPC), diffusé chaque mois par l’Insee. Ce panorama sur la manière dont l’inflation est mesurée éclaire sur l’évolution des données et des techniques utilisées et sur les enjeux auxquels les statisticiens sont confrontés.

N’ayant atteint 3 % que de manière exceptionnelle depuis le début des années 2000, l’inflation s’est accrue depuis mi-2021 jusqu’à atteindre 6,3 % en février 2023. Au mois d’avril 2023, les prix de l’alimentation étaient en hausse de 15 %, ceux des produits manufacturés de près de 5 %, ceux des services de plus de 3 %. La hausse des prix de l’énergie était proche de 7 %, contenue par le bouclier tarifaire et le tassement du prix des hydrocarbures, après les fortes hausses observées fin 2021 et début 2022.

L’indice des prix à la consommation (IPC) est sans aucun doute la statistique sur l’évolution des prix la plus commentée. Au plan national, il joue un rôle important pour différentes indexations : Smic, retraites, pensions alimentaires, loyers au travers de l’indice de référence des loyers fondé sur des composantes de l’IPC, etc. Les statisticiens voient quant à eux dans l’indice des prix une source statistique importante pour réaliser le partage volume-prix en comptabilité nationale et mesurer ainsi des grandeurs réelles (« à prix constants ») à partir de données en valeur (« nominales », en « euros courants »). Au plan européen, on parle d’indice des prix à la consommation harmonisé (IPCH, établi en France par l’Insee), dont le contour est défini par un règlement afin d’en assurer la comparabilité la plus robuste possible. Ceci permet de calculer un indice au niveau de la zone euro, que la BCE utilise comme référence pour sa cible d’inflation.

L’indice des prix à la consommation a pour très lointain ancêtre l’« indice des 13 articles » établi à partir de 1913 par la Statistique générale de la France, à la suite d’un épisode de flambée des loyers et des prix sur les marchés parisiens en 1911. Il n’a depuis eu de cesse de couvrir un champ toujours plus large de la consommation et du territoire, selon une méthodologie toujours plus précise et explicite.

Que mesure l’indice des prix à la consommation ?

Au plan mondial, un manuel conjoint du FMI, de l’OCDE, de l’ONU, de la Banque mondiale, de l’OIT et d’Eurostat fixe les principes et les méthodes à utiliser. Sa dernière actualisation date de 2020.

Au plan européen, et de manière simplifiée, l’indice mesure l’évolution du prix de la consommation finale des ménages faisant l’objet d’une transaction monétaire (l’autoconsommation de fruits et légumes ou encore les rémunérations en nature, par exemple, ne sont pas incluses). Chaque année, le « panier » de biens et services, représentatif de cette consommation, est revu pour tenir compte des familles de produits effectivement consommées et la part de chaque poste dans la consommation est actualisée. La règle suivie au plan européen est qu’un prix doit être suivi dès lors que la famille de produits représente au moins 0,1 % de la consommation totale. Il est en pratique construit à un niveau bien plus fin encore : il comporte 1300 familles de produits, qu’on appelle « variétés ».

Un indice de prix vise à mesurer l’évolution du prix des biens et services à caractéristiques inchangées, c’est-à-dire à « qualité constante ». Il s’agit idéalement, en référence à la théorie du consommateur, du montant supplémentaire à dépenser pour maintenir son utilité constante. Contrairement à une idée reçue, la « réduflation » (« shrinkflation »), en particulier, est prise en compte. Ainsi, la baisse de contenance d’une bouteille de soda à prix de vente inchangé est comptée comme de l’inflation par l’Insee. Symétriquement, le remplacement d’un produit par un modèle plus performant à prix de vente inchangé est enregistrée comme une baisse de prix, par exemple pour les produits électroniques.

Pour parvenir à mesurer l’évolution des prix à qualité constante, le principe est de suivre les mêmes produits, c’est-à-dire les mêmes références dans les mêmes points de vente, au fil des mois. Mais la consommation évolue, certains produits disparaissent, d’autres apparaissent : la stratégie de mesure de l’indice des prix se concentre en grande partie sur la prise en compte de cette réalité complexe.

En cours d’année, plusieurs méthodes sont utilisées en cas d’évolution des références disponibles. Certains types de produits sont suffisamment homogènes pour être remplacés directement, par exemple certains fruits et légumes. D’autres types de produits sont hétérogènes. Par exemple, un nouveau modèle de smartphone, dans une même gamme de prix, est souvent plus puissant ou doté d’un meilleur écran. Plusieurs stratégies sont utilisées pour distinguer l’évolution du prix et celle de la qualité dans ce cas de figure : observation des prix de l’ancienne référence et de la nouvelle à la même date, évolution du prix de produits de caractéristiques très proches, modèles « hédoniques » fondés sur une modélisation économétrique du prix pour le corriger de l’évolution des caractéristiques des produits.

À partir de quelles données ?

Une grande part de l’ingénierie de l’indice des prix a trait à la collecte d’information.

Des relevés de terrain sont nécessaires pour de nombreuses formes de vente et de nombreux produits (petit commerce, commerce spécialisé, artisans, marchés sur éventaire…). Ils sont réalisés par les enquêteurs de l’Insee, dans un échantillon de 99 agglomérations de plus de 2000 habitants et y compris dans les départements d’outre-mer.

L’indice des prix doit aussi tenir compte des achats effectués par internet. Chaque mois, 500 000 relevés sont réalisés sur internet : soit par moissonnage automatisé (« webscraping ») en lien avec les entreprises concernées, soit par des relevés manuels. Une partie des prix sont des tarifs, c’est-à-dire une liste de prix qui s’appliquent à un ensemble de consommateurs selon certaines dispositions contractuelles : tarifs réglementés et offres de marché du gaz et de l’électricité, tarifs de la sécurité sociale, prix des contrats d’assurance, des services de télécommunication, etc. Par ailleurs, les loyers sont mesurés grâce à l’enquête Loyers et Charges réalisée par échantillonnage de logements dont les ménages sont interrogés cinq trimestres d’affilée ainsi qu’à une enquête spécifique sur les loyers auprès des bailleurs sociaux.

L’apport des données massives : une révolution

Depuis 2020, l’IPC a connu une véritable révolution. Il  utilise maintenant les données de caisse des grandes surfaces à prédominance alimentaire, transmises à l’Insee par les distributeurs, pour mesurer l’évolution du prix de l’alimentation industrielle, des produits d’entretien et d’hygiène-beauté. L’Insee dispose ainsi du prix et des quantités vendues chaque jour, par code-barre et par point de vente, soit près de 80 millions d’enregistrements chaque jour. Les données utilisées pour le calcul mensuel de l’indice des prix se comptent donc maintenant en milliards !

L’utilisation des données de caisse répond à des objectifs d’efficience, cela dispensant d’une partie des relevés de terrain, mais surtout à des objectifs de qualité. Les données sont exhaustives sur le champ considéré. Disposer du volume (ou du chiffre d’affaires) à un niveau de granularité extrêmement fin est un progrès important. Disponibles au niveau des codes-barres (GTIN), les références sont regroupées selon environ 200 000 classes d’équivalence, au regard de plusieurs dizaines de caractéristiques : marques, contenance, produit bio ou non, etc. Procéder de cette manière permet de conserver l’avantage procuré par un niveau de détail très fin, notamment pour tenir compte précisément des effets qualité, tout en évitant les artefacts. Les codes-barres sont en effet modifiés non seulement lorsqu’une caractéristique évolue (contenance, etc.), mais aussi parfois selon le lieu de production (deux usines différentes) ou en cas de simple changement d’emballage.

Le moissonnage (« webscraping ») de données sur internet est une autre innovation. Il permet pour certains produits une mesure de l’évolution des prix plus fine et plus adaptée à l’évolution des modes de tarification et de consommation. Par exemple, par le passé, l’Insee utilisait les tarifs SNCF pour la mesure du prix du transport ferroviaire. Les modes de tarification ayant profondément évolué, les prix sont désormais relevés au moyen d’un robot internet, qui permet de construire plus de 10 000 micro-indices, en tenant compte des caractéristiques d’origine et de destination, de période du voyage, de type de tarif (conditions de remboursement, cartes de réduction), selon différentes antériorités de la réservation. Cette technique est particulièrement adaptée pour la mesure des prix des secteurs pratiquant le yield management.

Des enjeux de pédagogie et de communication

Les statisticiens ne peuvent se cantonner à ces travaux très techniques. Très utilisé, pour des indexations, pour la politique monétaire ou pour la mesure de grandeurs économiques, l’indice des prix est toujours scruté, souvent questionné, parfois objet de controverses. Expliquer à tous les publics ce que mesure l’indice des prix, et ce qu’il ne mesure pas, est un enjeu toujours vivace.

Par exemple, il faut souvent rappeler que la mesure des prix n’est pas une mesure du pouvoir d’achat, qui est tout autant une question de revenu, lui-même mesuré par d’autres statistiques. Un indice de prix n’est d’ailleurs pas un « indice du coût de la vie » : le panier de produits suivi est adapté d’année en année à l’évolution des habitudes de consommation, mais l’indice ne vise pas à mesurer le montant à dépenser quand apparaissent de nouveaux besoins. Il ne mesure que l’évolution des prix de ces produits. Autre particularité, les loyers sont dans l’indice des prix, mais pas l’achat d’un logement, qui constitue de l’investissement (formation brute de capital fixe en comptabilité nationale). En outre, l’indice des prix est une moyenne, qui masque des évolutions de prix différenciées selon les produits, chacun ayant ses propres besoins et habitudes de consommation. Cela peut expliquer certains écarts entre les chiffres et les perceptions individuelles.

La transparence sur les concepts et les méthodes utilisées, mais aussi la communication et la pédagogie sont donc essentiels. L’indice des prix à la consommation est diffusé de la manière la plus détaillée possible : près de 260 postes chaque mois, près de 360 chaque année. Différentes variantes sont également disponibles : séries spécifiques sur les départements d’outre-mer, indice selon la structure de consommation des ménages du 1er quintile de revenus, hors tabac, (utilisé pour l’indexation du Smic), indice des prix dans la grande distribution, indices selon les catégories socio-démographiques des ménages (revenus, composition familiale, âge…), etc.

Pour compléter ces éléments, l’Insee a calculé différentes variantes en repondérant les postes de l’indice des prix à la consommation pour différents types de ménages. Par exemple, l’inflation observée début 2023 apparaît plus importante pour les ménages les plus âgés, pour ceux des zones les moins urbanisées, ou encore pour les ménages modestes. Il met également à disposition sur son site internet un simulateur d’indice des prix « personnalisé », grâce auquel chacun peut entrer son propre jeu de pondérations et simuler son propre indice. Ce type d’approche est de nature à faciliter la compréhension de l’indice des prix, en n’observant pas uniquement des moyennes et en permettant de retracer des situations plus proches de situations individuelles.

L’indice des prix compte parmi les statistiques les plus détaillées, ce qui permet d’apporter de multiples explications et analyses aux utilisateurs. Pour aller plus loin, les lecteurs de Variances peuvent se plonger dans la bibliographie résumée présentée ci-dessous :

Banque Mondiale, Eurostat, FMI, OCDE, OIT, Unece – Consumer Price Index Manual – Concepts and Methods, 2020https://www.imf.org/en/Data/Statistics/cpi-manual

Big Data et statistiques – 2e partie, Les Big Data dans l’indice des prix à la consommation, Économie et Statistiques n°509, septembre 2019 – https://www.insee.fr/fr/statistiques/4203513?sommaire=4203531

Eurostat, Indices des prix à la consommation harmonisés – Méthodologie –  https://ec.europa.eu/eurostat/web/hicp/methodology

Insee, Indice des prix à la consommation vs. indice des prix des prix harmonisé au niveau européen : santé et énergie font la différence, Blog de l’Insee, mars 2022 – https://blog.insee.fr/ipc-vs-ipc-harmonise-sante-et-energie-comptent/

Insee, Début 2023, les écarts d’inflation entre les ménages sont accentués par la forte hausse des prix de l’alimentation et de l’énergie, Note de conjoncture, mars 2023 – https://www.insee.fr/fr/statistiques/6966784

Insee, Informations Rapides – https://www.insee.fr/fr/statistiques?taille=100&debut=0&categorie=2&collection=5

Insee, L’essentiel sur… l’inflation – Actualisé en février 2023 – https://www.insee.fr/fr/statistiques/4268033

Jaluzot, P. Sillard, Échantillonnage des agglomérations de l’IPC pour la base 2015 – Insee, Document de travail n°F1601, janvier 2016 – https://www.insee.fr/fr/statistiques/2022137

Leclair, Utiliser les données de caisse pour le calcul de l’indice des prix à la consommation, Courrier des Statistiques, 2019 – https://www.insee.fr/fr/information/4254225?sommaire=4254170

Touchelay, Un siècle d’indice des prix de détail français (1913‑2013) ou la métamorphose d’un pionnier de la politique du chiffre – Politiques et management public, 2014

 

Cet article a été initialement publié le 15 juin.

Aurélien Daubaire
Les derniers articles par Aurélien Daubaire (tout voir)