「2014 NICAR系列之二」没有数据怎么办?

分享给朋友:

[zilla_alert]今年三月初,一年一度的新闻骇客盛会NICAR(全称:The National Institute for Computer-Assisted Reporting,即美国计算机辅助报道协会)在美国巴尔的摩举行。在2014年NICAR会议系列报道中,亲临现场的数据新闻网作者们共同这一数据新闻领域的重要会议。

本系列文均为原创,转载请注明出处、网址与文章作者。

更多本系列文章:

【2014 NICAR系列之一】 新闻界极客的聚会
【2014 NICAR系列之二】没有数据怎么办?
【2014NICAR系列之三】新闻应用,静态页面VS动态页面
【2014  NICAR系列之四】一览无遗:数据新闻资源
[/zilla_alert]

当整个会议都在热火朝天地讨论数据新闻的时候, 有一个session给大家泼了一盆冷水:没有数据怎么办?

1,做自己的船长:自己收集数据建立数据库

很多时候数据新闻记者颇受数据供应方的掣肘,许多重要数据掌握在政府或者大企业的手中, 而这些机构正是记者所要报道(甚至揭露)的重点对象,当数据揭示的故事将与数据持有者的利益发生冲突的时候, 记者很难获取自己需要的数据;有些时候,故事所需的数据根本不存在。

纽约时报数据团队的领军人Sarah Cohen认为过分依赖政府数据和公司数据是目前数据新闻普遍存在的问题,USA Today的调查性记者Meghan Hoyer建议数据记者们“做自己的船长”, 自己收集数据并整理数据。在NICAR的讨论中,Sarah Cohen和Meghan Hoyer给出了建立数据库的几点建议:

  • 可以借鉴已经存在的结构类似的数据库,甚至可以向学界求助获得技术支持。
    成功案例:Hoyer的团队制作的专题 “Behind the bloodshed”关注美国近年来多发的大规模杀戮。在项目之初他们想使用FBI数据库,但发现FBI的数据库不仅不全,而且各个州之前的数据差异巨大。于是记者使用FBI对“大规模杀戮”的定义在LexisNexis的数据库中定位了每一次大规模杀戮事件,建立了自己的数据库并随时更新。
    Screen Shot 2014-05-06 at 23.13.41
  • 如果是从网上收集数据建立数据库,要及时对网页进行截图,避免网站修改信息查无对证。
    成功案例: A Tale of Two Prices 。华尔街日报的记者发现美国办公用品零售商Staple会根据用户的IP地址(和邮编)为同一商品实行不同价格且差价悬殊,于是建立了各个邮编之下的商品价格的数据库,用户既可以按自己的邮编查找,可以在地图上看到价格分布。
  • 利用crowdsourcing完成数据收集。
    成功案例: Turning The Camera Around: Health Care Stakeholders. 当全国都在关注医改法案的进程时,NPR的记者将镜头对准了旁听席上的人们,他们中的很多都是奔走在参议员中的说客,对医改法案的进程有重要影响。NPR希望读者能够找到照片中的人,[email protected],读者的贡献汇总在这里 。但crowdsourcing不适于时效性很强的项目,因为你无法要求人们在免费提供劳动的时候遵守截止日期。

在建立数据库这件事情上,做的最系统最持久最专业的还要数ProPublica, 他们的Free the Files项目是利用crowdsourcing完成数据收集的业界典范。

了解更多有关新闻机构数据库维护的内容,请移步这里

但是自己建立数据库意味着维护数据的准确性的重任完全落在了记者身上,核对事实就成了极其重要并且工程浩大的任务。Cohen建议在实施这样的项目之前要确认这个议题是否有强的重要性和影响力,并且要与刊物充分沟通获取必要的支持。上述成功案例无一例外背后有强大的刊物支持。

2,更进一步:利用无人机和感应器采集数据

无人机:Matt Waite来自内布拉斯加大学林肯分校新闻学院的无人机实验室,他将数据收集的讨论更进一步,分享了他和同事用无人机收集数据进行报道的经验。在报道内布拉斯加旱灾的报道 the Nebraska drought of 2012 的项目中,无人机完成了土壤取样和照片拍摄。但是无人机报道最近受到了FAA(美国联邦航空管理局)的阻挠,另一位通过无人机追踪阿拉斯加龙卷风的摄影师Brian Emfinger正在受到FAA的调查,甚至面临罚款。 Matt在接受采访的时候也表示在无人机报道方面还没有很明确的规定。

感应器:Matt在演讲中还提到一个设想,将感应器装在话筒上,放置在城市的各个角落,以收集这个城市噪声水平的数据。

关于NICAR:

2014 NICAR系列之一 新闻界极客的聚会

2014NICAR系列之三:新闻应用,静态页面VS动态页面

 

作者简介

邱悦

数据新闻和视觉记者,关注可视化、财经报道和调查性报道。