版本: English
了解人们的出行方式,最好了解支撑相关方式选择的动因,是交通规划人员的核心工作内容。
要规划路网或公共交通网络延伸或改造,评估新投资的可行性,评估现有交通系统为某地人口和企业服务的绩效,就要了解行程起始点及出行者如何选择出行线路、方式和目的地。
世界银行交通专家的大部分工作是支持借款客户建立了解上述内容的能力以及使用相关结果对投资项目进行评估的能力。
这一过程的核心是起始点调查,实际上就是绘制某地不同区域之间行程的矩阵图(即起始点矩阵图)。一般而言,获取某一城区的这一信息难度较大,成本较高,耗时较长。针对数以千计家庭开展的出行调查,加上对社会经济数据的延展分析,动辄耗资数百万美元。此外,我们往往也依靠主导道路和交通线路沿线的战略要点的数据来校验调查和分析结果。
这一过程耗时可能长达一年,其中许多阶段需要很专业的技术技能和大量质量控制。调查设计、调查人员培训、确保其正确办事(不编造数据、不错误地输入数据)以及随后的分析等诸多工作的开展,都需要较强的技术能力,同时也需要较强的技术技能来监督这些工作。
负责开展这些工作的所有人都在工作过程中有过可怕的经历,由此导致的结果是,测试备选方案和作出交通投资决策所需的基本信息很少收集——至多每十年收集一次,现有调查的结果甚至存在疑似缺陷。
如今,一个新的、可能的“大数据”来源有可能挽救上述情况,那就是“呼叫数据记录”(CDR)。这些记录源自普通人日常交易过程中形成的越来越多的“被动式数据”信息。手机每呼叫一次,手机基站——通常是最近的基站就会加以记录,作为收费依据。记录内容包括呼叫地点、时间和时长等大量数据。根据这些数据,就有可能以占传统方法所需成本的很小部分成本绘制出一张起始点矩阵图。
我们正在与麻省理工学院研究员玛塔·冈萨雷斯教授开展合作。她一直在编制相关规程,以规范巴西里约热内卢中心区的CDR数据分析工作,根据分析结果绘制该区起始点矩阵图。本文所附文章介绍了关于里约热内卢和马萨诸塞州府波士顿的部分初步比较结果(冈萨雷斯教授带领的团队曾在马萨诸塞州开展工作)。这些结果表明,CDR在今后数年中可以成为供交通规划人员使用的一种重要工具。
我们发现的数据包括:
- CDR数据。该数据覆盖五个月,涉及300万人,其中约25%来自里约热内卢中心区。起始点调查开展过程中,我们采用了小样本,即排除打电话太少或太多的手机用户后得到的样本。较之典型性入户调查,这一由50万用户组成的样本仍很大。例如,世界银行资助在里约热内卢和圣保罗开展的一项传统调查仅对1-3万户家庭进行了调查。
- 手机基站密度和分布数据。该数据相当准确的反映了交通规划的细微性和需求。我们的数据集涉及巴西里约州的1421座基站。这一数字与“出行分析区域”的大小和分布、传统规划分析单位很吻合——传统模型采用了该市中心区的730个区域。
需要指出的是,即便得出了结果,但 CDR数据仍需传统规划方法的诸多要素予以补充,因通过该数据并不能深入了解个人作出的选择和支撑这些其选择的动因。这些选择和动因对设计可行的新投资项目至关重要。
此外,也存在其它问题。尽管样本规模很大,但其中并不包括系统性自我选择的部分要素和不使用手机的人群。此外,我们仅掌握一家移动通信运营商的数据;如果不同人群对运营商有着系统偏好,则这些偏好就有可能对最终结果的准确性产生影响。
最后,关于CDR数据使用过程中隐私权问题的讨论正在进行。虽然我们使用的数据为匿名数据,而且仅针对很具体的研究用途提供,但评论人士却对滥用此类数据的可能性提出了关切。 因此,在大量使用CDR数据之前很好地解决此类关切至关重要。
我们的经验表明,我们正进入“大数据”时代,这一时代存在着偶然性二次使用数据的各种可能性。加上新一代计算技术强大的分析功能,这一契机为打破发展界 有着悠久历史(有时甚至是过时的)营商模式提供了可能。
加入讨论