Publié sur Blog de Données

Les données libre de la Banque mondiale dans Stata

Cette page en:

Stata est un logiciel d’analyse statistique très répandu dans les milieux de l’entreprise et de la recherche, que nous utilisons nous-mêmes à la Banque mondiale. Aussi saluons-nous l’arrivée de la nouvelle version du module wbopendata qui donne aux utilisateurs de Stata un accès direct à une grande partie des données disponibles sur le site donnees.banquemondiale.org.

Des universités et des centaines d’autres utilisateurs mettent déjà à profit les fonctionnalités de ce module. Nous vous invitons à le découvrir à votre tour.

Pourquoi passer par le module wbopendata pour accéder à nos données ?

Parce qu’il est essentiel de pouvoir accéder facilement aux meilleures données disponibles. Le module wbopendata est relié à l’API Open Data de la Banque mondiale et assure, grâce à l’interface de Stata, un accès direct aux données les plus récentes de la Banque, ce qui permet d’éviter des manipulations de téléchargement ou de gestion des données.

Quelles sont les caractéristiques de cette nouvelle version de wbopendata ?

La nouvelle version de wbopendata vous permet :

  • d’accéder à plus de 1 000 nouveaux indicateurs, soit un total de 5 300 séries chronologiques, contre 4 200 dans la version précédente ;
  • d’accéder aux métadonnées de la série téléchargée : définitions des indicateurs, nom de l’organisation et/ou de l’agence chargée de collecter les données, liens vers des informations supplémentaires, etc. ;
  • de générer facilement des cartes à partir des indicateurs téléchargés ;
  • d’accéder aux données dans l’une des trois langues reconnues par Stata : anglais, espagnol ou français.

Le module wbopendata vous permet d’obtenir les données recueillies pour plus de 256 pays et régions depuis 1960. Il inclut les séries suivantes :

Comment utiliser le module wbopendata ?

Les instructions figurent sur la page d’accueil de wbopendata. Pour installer le module, il suffit de saisir la ligne de commande suivante :

ssc install wbopendata

Une fois installé, le module wbopendata permet d’accéder à quatre options de téléchargement :

  • Par pays – Tous les indicateurs, pour toutes les années sélectionnées, pour le pays sélectionné (série des données WDI)
  • Par thème – Tous les indicateurs, pour le thème sélectionné, pour les années sélectionnées et pour tous les pays (série des données WDI)
  • Par indicateur – L’indicateur sélectionné, pour les années sélectionnées, pour tous les pays (n’importe quelle série de données)
  • Par indicateur et par pays – L’indicateur sélectionné, pour les années sélectionnées, pour le pays sélectionné (n’importe quelle série de données)

Après avoir installé le module, saisissez la ligne de commande suivante pour ouvrir l’interface graphique

db wbopendata

stata wbopendata window

Avec la nouvelle version de wbopendata, on peut également visualiser les métadonnées pour un indicateur donné. Par exemple, pour le nombre d’abonnements à la téléphonie mobile pour 100 habitants (code : it.cel.sets.p2), on obtiendra les métadonnées ci-dessous en saisissant la ligne de commande suivante :

wbopendata, language(en – English) indicator(it.cel.sets.p2) long clear latest

stata wbopendata window

Créer des cartes avec wbopendata dans Stata

Avec Stata, vous pouvez facilement créer des cartes à partir des données d’un indicateur :

. tempfile tmp
. wbopendata, language(en - English) indicator(it.cel.sets.p2) long clear latest
. sort countrycode
. save tmp', replace
. sysuse world-d, clear
. merge countrycode using
tmp'
. sum year
. local avg = string(r(mean)',"%16.1f")
. spmap  it_cel_sets_p2 using "world-c.dta", id(_id)                                  ///
clnumber(20) fcolor(Reds2) ocolor(none ..)                                  ///
title("Mobile cellular subscriptions (per 100 people)", size(*1.2))         ///
legstyle(3) legend(ring(1) position(3))                                     ///
note("Source: World Development Indicators (latest available year:
avg') using ///
Azevedo, J.P. (2011) wbopendata: Stata module to " "access World Bank databases, ///
Statistical Software Components S457234 Boston College Department of Economics.", size(*.7))

Avec ce code, vous obtiendrez une carte comme celle-ci :

stata wbopendata window

Reproductibilité de l’analyse et historique des séries de données

Le module wbopendata présente notamment l’avantage de faciliter la reproduction des analyses conduites dans Stata à partir des données WDI. Étant donné que la syntaxe utilisée pour l’analyse peut inclure le nom de la série de données et le code de téléchargement utilisés, les chercheurs sont en mesure d’indiquer beaucoup plus facilement comment tel ou tel résultat a été obtenu, d’où une information plus ouverte et plus transparente. En effet, l’analyse est dès lors reproductible par des tiers, et elle peut être actualisée plus aisément à mesure que de nouvelles données sont disponibles. Cette approche confère une portée nouvelle aux principes de la « programmation littéraire » développée par Donald Knuth, puisque même les données qui servent à l’analyse peuvent être incluses dans le code et mises à jour en temps réel.

Ce qui importe pour les utilisateurs de wbopendata, c’est de connaître précisément l’historique (l’ancienneté) de la série de données utilisée, dont la date d’extraction rend le mieux compte. Rappelons que wbopendata recourt à une série de données « live » qui sont actualisées au moins deux fois par an. Les données sous-jacentes auxquelles on accède via l’API évoluent donc constamment.

Faciliter l’accès des spécialistes aux données de la Banque mondiale

Si vous utilisez déjà le logiciel Stata, il vous suffit de télécharger la nouvelle version de wbopendata pour accéder aux données en libre accès les plus récentes de la Banque mondiale. Si vous utilisez le logiciel statistique open source R, il existe un module similaire disponible.

Le module wbopendata a été conçu et est géré par Joao Pedro Azevedo, qui travaille dans le service chargé des questions de pauvreté, de genre et d’équité au sein du département de lutte contre la pauvreté et de gestion économique de la Région Amérique latine et Caraïbes de la Banque mondiale.

 

Auteurs

Prenez part au débat

Le contenu de ce champ est confidentiel et ne sera pas visible sur le site
Nombre de caractères restants: 1000