L’équipe de la Banque mondiale chargée du Programme de comparaison internationale (PCI) a commandé une étude pilote consacrée à la collecte de données assistée par les technologies de l’information et de la communication (TIC). Menée entre décembre 2015 et août 2016, cette étude couvre 15 pays : Afrique du Sud, Argentine, Bangladesh, Brésil, Cambodge, Colombie, Ghana, Indonésie, Kenya, Malawi, Nigéria, Pérou, Philippines, Venezuela et Viet Nam.
Il s’agissait principalement d’examiner la faisabilité de l’application d’une approche participative pour la collecte de données sur les prix. Cette méthode paraissait intéressante à plusieurs égards, en raison de plusieurs caractéristiques : des données et des métadonnées ouvertes, présentant une bonne granularité et rapidement disponibles. Autant de caractéristiques peu fréquentes avec les jeux de données dont disposent généralement les pouvoirs publics et les chercheurs.
Les données ont été collectées sur le terrain via un réseau privé composé d’agents rémunérés, les « contributeurs », qui disposaient d’un smartphone et d’une application dédiée. Cette application présentait les consignes et indiquait les prix à relever, et à quel endroit. Après avoir relevé les prix, les contributeurs les communiquaient, avec les métadonnées, au moyen de cette application. Ils étaient rémunérés en fonction du lieu et du degré de difficulté.
Les données recueillies portent sur 162 articles précis correspondant à diverses catégories de biens et consommés par les ménages : produits alimentaires et boissons non alcoolisées ; boissons alcoolisées et tabac ; vêtements et chaussures ; logement, eau, électricité, gaz et autres combustibles ; meubles, équipement ménager et dépenses d’entretien courant ; services de santé ; transports ; communications ; loisirs et culture ; éducation ; hôtels et restaurants ; autres biens et services. Les spécifications communes des articles garantissent la qualité des données, ainsi que leur comparabilité sur le plan national et international.
En tout, l’étude pilote a permis de relever 1 262 458 prix, dont 96 188 au Brésil, le pays le plus documenté, à 14 102 au Cambodge. La figure ci-dessous présente le nombre total de prix relevés et de points de vente concernés, par pays et par mois (passez votre souris sur le graphique pour accéder aux données).
Image 1 : Nombre cumulé de prix relevés
La granularité des données collectées permet une analyse au niveau national ou infranational. Le graphique suivant représente les relevés de prix disponibles au niveau des États fédérés ou des municipalités, dans chaque pays couvert par l’étude pilote (passez votre souris sur le graphique pour accéder aux données).
Image 2 : Nombre total de prix relevés
Les données de prix s’accompagnent d’un vaste ensemble de métadonnées (coordonnées GPS, désignation géographique, horodatage, volume et poids de l’article, informations sur la marque et le modèle, etc.), ce qui permet une analyse géographique et temporelle détaillée.
Voici un exemple des relevés de prix disponibles pour Rio de Janeiro (Brésil), présentés sur la base des coordonnées GPS (longitude et latitude) de chaque point de vente.
Image3 : Localisation des relevés de prix à Rio de Janeiro (Brésil)
Les données collectées peuvent servir, entre autres, à des études sur la variabilité géographique des prix entre pays ou à l’intérieur d’un pays, ainsi qu’à des analyses temporelles, comme l’illustrent les exemples ci-après.
La première carte, ci-dessous, représente les niveaux de prix pour la catégorie « Produits alimentaires et boissons non alcoolisées », et repose sur les données recueillies dans les cinq pays d’Afrique couverts par l’étude pilote.
Image 4 : Indices des niveaux de prix (INP), nombre d’articles concernés et nombre de relevés dans les pays d’Afrique couverts par l’étude pilote
La deuxième carte représente les niveaux de prix dans la catégorie « Consommation des ménages », et repose sur les données recueillies dans les douze États du Brésil où l’étude pilote a été menée.
Image 5 : Indices des niveaux de prix (INP), nombre d’articles concernés et nombre de relevés dans les États du Brésil couverts par l’étude pilote
Le dernier graphique, ci-dessous, représente les prix mensuels moyens, le nombre de relevés et les coefficients de variation (CV) pour une sélection d’articles au Brésil.
Image 6 : Prix mensuels moyens (en réaux brésiliens), nombre de relevés et coefficient de variation (CV) pour une sélection d’articles au Brésil
Voici les principaux constats et enseignements tirés de l’étude pilote :
Les technologies actuelles permettent effectivement de recourir à une approche participative pour la collecte de données sur les prix. Certains paramètres, comme la précision des coordonnées GPS, ont tendance à varier suivant le smartphone utilisé, mais ces problèmes technologiques ne sont pas très graves. Il est par ailleurs possible de constituer un réseau de contributeurs dans la plupart des pays. Et le prix et le coût d’un smartphone ayant chuté, le nombre de contributeurs potentiels augmente, ce qui réduit le biais éventuel lié au groupe de contributeurs.
La couverture de l’enquête tend à varier selon le pays ou la région. On obtient en général de meilleurs résultats dans les pays et les régions où le réseau de téléphonie (sans fil ou haut débit) et le réseau de contributeurs sont plus denses. En outre, le taux de couverture est plus élevé quand les contributeurs peuvent recevoir des micro-paiements. Par contre, dans les pays où les pouvoirs publics se méfient des sources alternatives de données, il peut être difficile de mettre en œuvre ce type d’approche.
La qualité des données collectées dépend largement de la convivialité de l’application, ainsi que de la clarté de la définition des articles. La surveillance du comportement des contributeurs et l’analyse des métadonnées permettent assez facilement de déceler et de signaler les éventuels cas de fraude. Il est capital d’optimiser la méthode et l’application de collecte pour éviter les séries de données frauduleuses et la présence d’échantillons de trop grande taille pour un article ou une zone en particulier.
La viabilité de la méthode dépend principalement des utilisateurs et de l’efficacité de la collecte des données. On pourrait réduire nettement le coût par série de données et par utilisateur en regroupant les besoins en données et les moyens financiers. Il faut également que l’entreprise privée qui gère le réseau de contributeurs soit un opérateur consciencieux et fiable pour mener à bien cette tâche à moyen et long terme.
Enfin, les données recueillies dans le cadre d’une approche participative présentent l’avantage d’être librement et rapidement accessibles, pour tous les utilisateurs. De fait, toutes les données, accompagnées de leurs coordonnées GPS et métadonnées, sont publiées dans notre base de données sur le développement (a).
Nous vous invitons à nous faire part de vos réactions ou de vos questions sur cette méthode, ainsi que sur vos suggestions d’applications, dans la section Commentaires ci-dessous, ou en écrivant à icp@worldbank.org.
Prenez part au débat