Publié sur Opinions

Libre accès aux données de la Banque : 2 ans déjà, par Shaida Badiee

Cette page en:

Nous célébrons aujourd’hui le deuxième anniversaire de l’initiative de la Banque pour le libre accès à ses données, lancée officiellement le 20 avril 2010 par le président Robert Zoellick, qui avait déclaré à cette occasion :

 

« Il est important de mettre les données et connaissances de la Banque mondiale à la disposition de tous. Les statistiques racontent l’histoire des personnes vivant dans les pays en développement et émergents, et peuvent à ce titre contribuer pour une bonne part à faire reculer la pauvreté. »

C’est pour marquer cet anniversaire que nous avons créé ce nouveau blog, spécifiquement destiné à permettre les échanges sur tout ce qui touche aux données, à la notion de libre accès et aux rapports que cela a avec le développement. Ce premier billet va être pour moi l’occasion de revenir brièvement sur le chemin parcouru, mais aussi et surtout d’esquisser certaines des orientations que nous comptons suivre pour l’avenir.

Au départ, nous avons principalement cherché à rendre nos séries actuelles de données publiques aussi accessibles que possible, et ce gratuitement, en prenant appui sur la nouvelle Politique d’accès à l’information de la Banque. Mais pour nous assurer de la fonctionnalité de nos données, nous avons commencé par « manger ce qu’on donne à notre chien » (selon l’expression anglaise consacrée, Eating your own dog food), c’est-à-dire mis au point notre site de données en nous servant des mêmes contenus et outils (l’API, ou interface pour la programmation d’applications) que ceux mis à la disposition du public. Nous avons aussi défini des Conditions de « libre » utilisation de ces données, assorties d’un seul et même catalogue regroupant l’ensemble de nos ressources.

À partir de là, nous avons entrepris d’enrichir ce catalogue à un rythme soutenu. C’est pourquoi il contient aujourd’hui bien plus d’indicateurs de développement (plus de 8 000, contre 2 000 lors du lancement du site), ainsi qu’une nouvelle interface et API pour l’accès aux données sur les projets de la Banque, permettant notamment, grâce au géocodage, de cartographier les résultats des projets. Il contient aussi des séries de données sur les aspects financiers des opérations de la Banque (son nom justifie bien cela, après tout), ainsi qu’une base de micro-données tirées par exemple d’enquêtes auprès des ménages — un type de ressource extrêmement prisé dans les milieux de la recherche sur le développement. Cette semaine encore, nous avons mis à jour la base de données des Indicateurs du développement dans le monde, qui était à l’origine même de notre concept de données en libre accès, en y ajoutant le contenu de l’édition 2012 de ces indicateurs.

Ce surcroît d’ouverture nous a permis également de diversifier la façon dont nos données sont présentées : en publiant le Registre de l’Initiative internationale pour la transparence de l’aide, en créant un mashup qui combine sur une même carte la localisation des projets de la Banque et les progrès réalisés au regard des indicateurs de développement, et en lançant des applications interactives pour permettre une meilleure analyse de séries de données clés dans différents domaines — pauvreté, changement climatique, emploi, inclusion financière, flux d’aide, etc. Nous avons aussi mis au point des applications pour mobiles, et offrons ainsi des applications gratuites pour toutes les principales plateformes. Pour finir, la Banque vient de lancer en début de mois le portail des Archives ouvertes du savoir (Open Knowledge Repository, ou OKR), qui donne déjà accès à plus de 2 100 ouvrages et articles de recherche sous licence libre Creative Commons (CC-BY) et en ajoute de nouveaux toutes les semaines.

Ce bilan est impressionnant en soi, mais nous n’en avons pas moins appris que d’autres que nous peuvent dans bien des cas faire mieux que nous. Les développeurs de logiciels n’ont pas tardé à concevoir des applications faisant appel à nos données. Le concours Développeurs au service du développement que nous avons lancé l’année dernière a ainsi remporté un franc succès, de même que notre autre concours, Vos applis pour le climat, le mois dernier. Pour résoudre les problèmes de développement, il faut les comprendre ; dans cet esprit, des statisticiens et concepteurs ont mis au point des modes de visualisation étonnants par leur aspect novateur, et des vulgarisateurs nés tels que Hans Rosling ont donné vie aux chiffres pour aider à expliquer et élucider les grands problèmes qui sous-tendent les politiques de développement. Maintenant, de quoi demain sera-t-il fait : comment gérer l’essor des données en ligne et de leurs propriétés respectives ; comment nous assurer que les données fournies, qui servent souvent à décrire des phénomènes complexes, peuvent être interprétées et utilisées de manière correcte ; comment faire en sorte que nos données en libre accès puissent avoir un impact sur notre mission consistant à lutter contre la pauvreté ?

Nous nous sommes interrogés sur ces questions, parmi d’autres, au cours de ces derniers mois, et voici quelques-uns des principes et priorités sur lesquels cette réflexion a débouché :

Tisser de meilleurs liens entre les différents moyens d’accès libre aux données. Il convient d’intégrer entre elles les différentes sources, mais en prenant soin de ne pas restreindre leur développement : c’est le principe même des « petites pièces jointes dans le désordre » (pour reprendre l’expression anglaise désormais célèbre small pieces loosely joined) au moyen de normes ouvertes pour les métadonnées. Une priorité majeure consiste à établir un catalogue de données amélioré, en combinant des séries de données de différentes origines. C’est ce que nous avons commencé à faire cette semaine, en employant cette formule pour revoir la conception des pages pays de notre site de données.

Fournir de meilleures métadonnées. Les données à elles seules ne suffisent pas : dans bien des cas, la qualité compte tout autant, et il faut aussi que le contexte et la documentation (métadonnées) soient accessibles. Pour cela, il faut que les spécialistes des données de la Banque fournissent une documentation sous des formes accessibles, pratiques et permettant des recherches, mais ce n’est pas tout : il convient tout autant de mettre en ligne des mécanismes de type communautaire pour permettre l’échange des connaissances provenant d’autres producteurs et utilisateurs de données.

Favoriser l’interaction et l’utilisation. Nous comptons continuer d’améliorer les outils disponibles pour l’accès à nos séries de données et leur visualisation. À titre d’exemple, nous avons dernièrement amélioré notre application DataBank pour permettre aux utilisateurs d’enregistrer et de partager leurs propres rapports, graphiques et cartes. Notre objectif est de mettre au point — et à votre disposition — de nouveaux outils novateurs pour vous aider à explorer nos données.

Cadrer davantage avec les réalités locales. Dans bien des cas, les données ont le plus de portée quand elles permettent de répondre à des problèmes qui se posent avec acuité au plan local. Pour répondre à cette demande, il s’agit de trouver des moyens de fournir un surcroît de données de niveau infranational ou opérationnel, en assurant des mises à jour plus fréquentes et en prévoyant un meilleur appui dans les langues locales. Nous travaillons actuellement à la « mise en forme » d’indicateurs de développement clés de niveau infranational, et avons commencé à collaborer avec les pays pour soutenir leurs efforts dans le sens du libre accès à leurs propres données.

Être plus à l’écoute, et soutenir la communauté internationale. Nous estimons d’avis qu’il devrait être plus facile de poser des questions, d’obtenir des réponses et de donner des avis, et nous entendons être réceptifs aux messages qui nous sont communiqués et fournir notre appui à tous ceux qui, à travers le monde, travaillent au libre accès aux données. Nous avons commencé à agir en ce sens : nous envisageons ainsi de rendre possibles des échanges en ligne sur les séries de données que nous publions, par le biais de blogs et de forums communautaires ; et nous allons, en collaboration avec le Gouvernement américain, accueillir au siège de la Banque mondiale la prochaine International Open Government Data Conference, du 10 au 12 juillet 2012.

Nous avons d’ores et déjà commencé à mettre en application certains de ces plans, mais nous n’en voulons pas moins entendre ce que vous avez à dire. Que pensez-vous de tout cela ? Avons-nous omis ou oublié quoi que ce soit ? J’attends avec intérêt vos avis.


Prenez part au débat

Le contenu de ce champ est confidentiel et ne sera pas visible sur le site
Nombre de caractères restants: 1000