发表于 数据博客

从Stata中获取世界银行公开数据

版本:

Stata是一种在商界和学术界得到广泛应用的统计计算软件。世界银行也使用了该软件,同时其新版wbopendata(世界银行公开数据)模块的推出令人欣喜。该模块可使用户直接获取data.worldbank.org网站上收录的大部分数据。

目前,学术机构数以百计用户已然在利用该模块的优势 – 为什么不试一试呢?

为什么要使用wbopendata模块获取数据?

方便地获取现有最佳数据很重要。Wbopendata模块接入世界银行公开数据应用程序界面,便于用户通过Stata界面直接获取世界银行的最新数据 -- 通过该模块,用户无需对数据进行不必要的下载和管理。

新版wbopendata模块有哪些新特点?

该模块便于用户:

  • 获取1000个新增指标,可获取的时间系列数据总数从4200个增加到5300个。
  • 获取所下载的序列数据的元数据,包括指标定义、负责指标收集的组织或机构以及同现有支持性信息的链接。
  • 轻而易举地将下载的指标链接到Stata网站上的地图。
  • 以英文、西班牙文和法文三种文本获取Stata网站上的数据。

该模块便于用户获取1960年以来超过256种出版物和各地区的信息。可获取的数据集包括:

如何使用wbopendata模块?

按照wbopendata网站主页上的说明输入以下指令安装该模块:

ssc install wbopendata

安装完毕后,该模块可提供四个下载选项:

  • 国别 – 通过该选项可下载选定国家在选定年份的所有指标(《世界发展指标》数据集)
  • 专题 – 通过该选项可下载各国在选定年份关于选定专题的所有指标(《世界发展指标》数据集)
  • 指标 – 通过该选项可下载各国在选定年份的选定指标(任一数据集)
  • 指标与国别 – 通过该选项可下载选定国家在选定年份的选定指标(任一数据集)

 安装完毕后,输入下列指令,打开该模块的图示板:

db wbopendata

stata wbopendata window

新版wbopendata模块也可以显示给定指标的元数据,如您使用指标代码it.cel.sets.p2.输入下列指令后,可获得“每百人手机订购量”指标的元数据:

wbopendata, language(en – English) indicator(it.cel.sets.p2) long clear latest

stata wbopendata window

用wbopendata模块可在Stata上制作地图

您可以轻松地利用此类指标的数据在Stata上制作地图:

. tempfile tmp
. wbopendata, language(en - English) indicator(it.cel.sets.p2) long clear latest
. sort countrycode
. save `tmp', replace
. sysuse world-d, clear
. merge countrycode using `tmp'
. sum year
. local avg = string(`r(mean)',"%16.1f")
. spmap  it_cel_sets_p2 using "world-c.dta", id(_id)                                  ///
clnumber(20) fcolor(Reds2) ocolor(none ..)                                  ///
title("Mobile cellular subscriptions (per 100 people)", size(*1.2))         ///
legstyle(3) legend(ring(1) position(3))                                     ///
note("Source: World Development Indicators (latest available year: `avg') using ///
Azevedo, J.P. (2011) wbopendata: Stata module to " "access World Bank databases, ///
Statistical Software Components S457234 Boston College Department of Economics.", size(*.7))

(点击即可运行)

上述代码应能生成类似下面的地图:

stata wbopendata window

分析结果可复制,同时可跟踪数据集的制作时间

wbopendata 模块的重要优势之一是其便于复制任何使用Stata上的《世界发展指标》数据所作的分析。该模块大大方便了分析人员记录特定结果是如何获得的,因为进行分析时所采用的架构法可嵌入分析过程中所采用的实际序列数据的名称和下载这些数据所需的实际代码。这样做便于更公开和更透明地形成知识,因为该模块便于复制其他机构或人员所作的分析结果,也更便于在最新数据出台后更新之前的分析结果,还便于我们进一步深入理解Donald Knuth提出的文档式编程原则,因为甚至分析过程中所采用的数据也可以被嵌入代码并得到实时更新。

对该模块的用户而言,一个重要提示是要仔细记录所采用的数据集的制作时间,而获得该时间的最佳途径是序列数据的提取日期。重要的一点是要记住该模块接入的是每年至少更新两次的实时数据集,因此通过应用程序界面获得的支持性数据会不断变化。

新版wbopendata模块更便于专业人士用户获取世界银行数据

因此,如您是Stata软件的用户,请下载最新的wbopendata模块,开始使用世界银行最新的公开数据。如您使用的是公开源R型统计软件,可使用类似模块

wbopendata模块由世界银行拉美和加勒比地区减贫和经济管理局贫困、性别和公平问题处工作人员Joao Pedro Azevedo开发并维护。

 

加入讨论

此字段内容保密,不会公开显示
留言字数: 1000