Alors que les phénomènes météorologiques extrêmes s'intensifient et que les crises sanitaire et économique mondiales mettent en péril les progrès accomplis dans l'élimination de la pauvreté et la réalisation des Objectifs de développement durable (ODD), il n’a jamais été plus indispensable de mesurer les effets de ces chocs sur les ménages. Les enquêtes auprès des ménages représentent une source de données essentielle pour suivre les progrès enregistrés dans plus d'un tiers des 234 indicateurs des ODD et, à ce titre, elles aident à comprendre l'incidence des interventions politiques.
Cependant, dans les pays à revenu faible ou intermédiaire, les instituts nationaux de la statistique peinent à satisfaire cette demande de données en constante augmentation. Les taux de réponse aux enquêtes auprès des ménages diminuent, la longueur des questionnaires finissent souvent par lasser les répondants, ce qui entraîne une baisse de la qualité des données. De plus, la coordination laisse à désirer au sein de systèmes statistiques très sollicités. La pandémie de COVID-19 a révélé la vulnérabilité de ce type d’enquêtes, la quasi-totalité des pays ayant cessé de recueillir des données en mai 2020 (a). À mesure que les technologies de collecte de données évoluent, les instituts sont en outre confrontés à un magma complexe de sources de données nouvelles et potentiellement concurrentes. Une vision ambitieuse s’impose si l’on veut transformer les systèmes d'enquête auprès des ménages et contribuer ainsi à la réalisation des ODD.
Dans un récent article de recherche (a) produit par le programme d'études sur la mesure du niveau de vie (LSMS) (a) de la Banque mondiale et la Division de statistique des Nations Unies (a), sous l'égide du Groupe de travail inter-secrétariats sur les enquêtes auprès des ménages (a), nous mettons en évidence huit priorités techniques à envisager pour la prochaine décennie. Ces domaines prioritaires ont été déterminés en fonction de trois grands critères : 1) ceux dont l’utilité a été démontrée ou qui présentent un fort potentiel d'impact à moyen terme ; 2) ceux qui permettent à la fois de construire une base de données solide et de repousser les limites de la recherche et du développement et 3) ceux qui sont plus susceptibles de bénéficier aux pays à revenu faible ou intermédiaire, où les améliorations sont les plus nécessaires.
1. Intégrer davantage les enquêtes auprès des ménages aux sources de données traditionnelles et nouvelles
L'intégration entre données d'enquête et autres sources (recensements, données géolocalisées, données administratives, etc.) permet d’améliorer à la fois la pertinence et la rentabilité de la production de données d'enquête. Cela passe par l’harmonisation des concepts et des définitions entre les différentes sources de données, l'amélioration de l'accès à d'autres sources de données au niveau des producteurs de données d'enquête, la promotion de l'interopérabilité des données dès la conception des enquêtes et la protection de la confidentialité des données. Il faut en outre établir un cadre de qualité rigoureux qui permette de mettre en évidence et quantifier les erreurs provenant de sources de données non traditionnelles et de les distinguer de celles qui apparaissent au cours du processus d'intégration des données.
2. Concevoir et mener des enquêtes plus inclusives et centrées sur les répondants
La baisse des taux de réponse totale et partielle nuit à la qualité des enquêtes auprès des ménages. Le recours à des substituts pour répondre aux questionnaires lors de la collecte de données au niveau individuel constitue un problème connexe. Il est possible de surmonter ces difficultés en transformant les répondants en collaborateurs et coproducteurs, et en adoptant des protocoles de travail sur le terrain qui maximisent le taux d'autodéclaration parmi les adultes qui communiquent des informations personnelles.
3. Améliorer l'efficacité et la couverture de l'échantillonnage
Il est essentiel d'améliorer en permanence les cadres d'échantillonnage et d'adopter des techniques innovantes. On peut recourir, par exemple, au géocodage des données de recensement, aux données satellitaires à haute résolution lorsque le cadre de recensement est obsolète et à la création d'un cadre d'échantillonnage intégré pour améliorer la couverture.
Pour les populations difficiles à atteindre, le sur-échantillonnage et l'échantillonnage en réseau permettent d'améliorer la couverture, tandis que les modèles d'apprentissage automatique peuvent favoriser un échantillonnage plus ciblé (a). Grâce aux progrès de la collecte des données par voie électronique, des plans d'échantillonnage réactifs et adaptatifs peuvent permettre de réduire les coûts en favorisant des prises de décision en temps réel durant le processus de collecte.
4. Améliorer les méthodes de collecte de données objectives afin d’éviter les erreurs de mesure systématiques
Les erreurs systématiques dues à différents biais (biais de mémoire, fausses déclarations, biais de désirabilité sociale, etc.) vont fausser l'analyse des politiques réalisée à partir des données des enquêtes. Depuis une dizaine d’années, la recherche méthodologique préconise d'utiliser des outils de mesure directe afin de renforcer la précision et la portée de la collecte des données tout en réduisant la charge pour les répondants. On peut notamment citer la technologie GPS pour mesurer la superficie des parcelles, l'empreinte génétique afin d’identifier les variétés de cultures et les kits d'analyse bon marché qui permettent d’évaluer la qualité de l'eau.
Ces outils ayant un coût non négligeable, ce qui peut freiner une adoption à grande échelle, il est possible de limiter la mesure directe à un sous-échantillon et de recourir à des méthodes d'imputation afin d’obtenir des estimations pour les unités non couvertes.
5. Renforcer les capacités pour la réalisation d'enquêtes CAPI, téléphoniques, en ligne et mixtes
L'arrêt des enquêtes en face-à-face pendant la pandémie de COVID-19 a renforcé la nécessité de développer les enquêtes par téléphone, en ligne et mixtes. Si les enquêtes en face-à-face restent pertinentes, il est impératif de renforcer la collecte de données à distance, en particulier dans les pays à revenu faible ou intermédiaire. Par exemple, le recours complémentaire à des enquêtes par téléphone et par internet permettrait de satisfaire plus rapidement les besoins de données pendant ou après une situation d'urgence.
6. Systématiser la collecte, le stockage et l'utilisation des paradonnées et des métadonnées
Les économies avancées collectent des paradonnées dans le cadre du processus de collecte des données. Il peut s'agir par exemple de l’enregistrement des frappes du clavier ou du suivi GPS de la localisation de l'enquêteur. Ces paradonnées permettent d'améliorer la qualité des données d'enquête, mais elles sont malheureusement peu utilisées dans les pays à faible revenu. À l'avenir, il faudra améliorer la recherche et l'expérimentation sur l'utilisation des paradonnées collectées dans le cadre des dispositifs d’entretiens personnels/téléphoniques assistés par ordinateur (CAPI/CATI) mis en place dans des pays à faible revenu.
Les métadonnées (date de l'entretien, identifiants des ménages de remplacement et raisons des remplacements) jouent également un rôle essentiel dans le suivi de la progression et de la qualité de la collecte des données, ainsi que dans la réalisation d'études ex post, notamment sur l’effet enquêteur.
7. Développer les capacités d'apprentissage automatique et d'intelligence artificielle
L'intelligence artificielle (IA), l'apprentissage automatique et l'analyse prédictive peuvent améliorer l'efficacité à chaque étape d’une enquête. Par exemple, l'apprentissage machine permet de coder automatiquement les réponses aux questions ouvertes. Les arbres de classification permettent de construire un modèle prédictif à partir d'informations existantes issues d'enquêtes et de données administratives, ce qui améliore l'efficacité de l'échantillonnage pour de petits groupes de population. L'IA et l'apprentissage automatique jouent également un rôle essentiel dans les applications qui intègrent les données des enquêtes auprès des ménages à de nouvelles sources de données, comme l'imagerie satellitaire à haute résolution ou les relevés d’appels.
Cependant, le recours à ces techniques dans les enquêtes auprès des ménages reste concentré dans les pays disposant de systèmes statistiques plus avancés. C'est pourquoi il faut prioriser le renforcement des capacités en matière d'apprentissage automatique et d'IA dans les instituts nationaux de la statistique des pays à faible revenu.
8. Améliorer l'accès aux données, leur découvrabilité et leur diffusion
L'exploitation des enquêtes auprès des ménages au service du développement est d’autant plus efficace que celles-ci sont mises à disposition pour être utilisées et réutilisées. À l'avenir, les producteurs de données devraient s’attacher à rendre publics dans les meilleurs délais les séries de données issues de ces enquêtes. Il conviendrait également d'envisager de fournir un accès sécurisé aux microdonnées confidentielles afin de faciliter leur utilisation et la recherche.
Une vision ambitieuse s’impose si l’on veut transformer les systèmes d'enquête auprès des ménages et contribuer ainsi à la réalisation des ODD.
Aider les instituts nationaux de la statistique
Les données d'enquête sont un outil important pour concevoir, mettre en œuvre et évaluer les politiques publiques. Dans les économies à faible revenu, les instituts nationaux de la statistique ne peuvent pas améliorer les enquêtes auprès des ménages sans la mobilisation et le soutien des décideurs politiques et des partenaires de développement. Le renforcement des capacités dans diverses compétences en matière de données, la promotion d'une culture de l'expérimentation, l'investissement dans les infrastructures des technologies de l'information et de la communication (TIC) pour permettre l'innovation technologique, et le financement sont essentiels pour que les pays puissent mettre en œuvre avec succès les huit priorités énoncées ci-dessus.
Rappelons enfin que Groupe de travail inter-secrétariats sur les enquêtes auprès des ménages (a) est là pour soutenir ces activités.
Prenez part au débat