中国数据新闻工作坊培训手册第一章 – 数据新闻简介(视频)

分享给朋友:

什么是数据新闻

人类社会中数据无处不在。政府收集数据,公司产生数据,每个个人在网上也都留下了一长串的印迹。数据可以就社会和环境的状态提供详细准确的信息。这也正是新闻工作者必须能够懂得数据、并以数据传达信息的原因。

但大多数新闻工作者并没有数据方面的培训。在我们社会中,使用数据所要求的知识和技能(比如统计分析和电脑编程),通常是教给工程师和科学家的。与此同时,工程师们却没学过如何就一则新闻进行调查或向公众传达。数据新闻工作者使用量化技能来收集、分析和传达信息。

我们来看几个例子。下面是一些数据:

Data Journalism Manual - Introduction 1

这是美国政府发布的官方失业数据,是按年龄、性别、种族组织的。这些数据谁都可以免费得到,但却不是新闻,因为它不是以人们容易理解的形式呈现的。对一个普通人来说,这些数据有什么意义呢?

这儿是《纽约时报》上的一则互动新闻,显示的正是与上面同样的数据:

Data Journalism Manual - Introduction 2

与政府数据相比,《纽约时报》所做的一大改善,就是显示了一个时段里的失业率,这样你可以看出趋势。另外,它没有只做一个全国总失业率的曲线,而是就种族、性别、年龄和教育水平的每种组合各做了一个曲线。这样,你可以针对自己的情况,选择适合自己的曲线,来考察它与其他种类人们的不同。比如,受过良好教育的白种男人,在2008年金融危机后,通常没有失业 - 他们的失业率约为8%。但没有上完高中的年青拉美裔女性,在金融危机后的失业率几乎是50%。换句话说,金融危机对有些社区基本上没有影响,而对有些社区却打击甚重。

这就是一则报道,一则将数字和人们的生活、以及我们生活在同一社会中不同的经历连接起来的叙述性故事。数据新闻工作者的工作,就是要创作这样的叙述报道,使我们能更好地了解社会中在发生什么、以及如何改善我们共同的处境。

数据类型多种多样,数据新闻报道类型也多种多样。新闻工作者使用的并不仅限于政府数据。有些时候新闻机构甚至自己要生产数据,从而了解或传达新闻。比如,2013年青岛管道爆炸发生后,财新记者使用装备有GPS的手机在事发地拍摄了照片,并把这些照片按其所在地点放到了一个互动地图上。

Data Journalism Manual - Introduction 3

数据不只是数字。数据也可以是字词、照片、视频、或者可以储存在电脑里的任何形式的信息。数据,就像上述青岛管道爆炸事件所有的照片和照片地点一样,不过是一组相关信息的组合。

数据新闻也不只是数据可视化。虽然可视化常常是呈现数据的一个特别好的形式,有些类型的数据报道其实只是文字而已。这儿是《南华早报》上的一则报道,标题是,“香港潮湿到可以毁掉你的iPhone吗?”

苹果公司在香港推销iPhone很卖力, 使得iPhone的流行程度在该城市远超过其它的智能手机。但是苹果还没有考虑到这种可能,即该手机可能并不适合相对湿度经常超过95%的地方。

香港的湿度常常超过95%。据香港气象台数据,尖沙咀6月1日到8月16日之间,湿度超过95%的天数超过1/3,为28天.

数据新闻并不是新概念

实际上,在新闻机构开始使用数据可视化之前,数据新闻就已经存在多年了。

1967年,数据新闻先驱菲利普·梅耶 (Philip Meyer) 在对底特律种族暴乱进行报道。当时成千上万的人们在底特律街头聚集,最终43人死亡,7000人被捕。梅耶回忆说,

编辑和记者们开始反思这样一个问题,即经过所有汗流浃背的工作和努力报道真相之后,仍然没有人知道暴乱者是谁、他们为什么暴乱。

很多人说暴乱者之所以上街,是因为他们对自己贫困、得不到教育、也没有工作的状况很不满。梅耶想知道事实是否如此,所以他出资请人做了一个调查。调查人员在暴乱者所居住区域随机选择了一些家庭进行访问,收集了几百人的年龄、就业、收入、种族、受教育程度等信息,包括这些人有没有上街去参加暴乱。

对收集到的答复的分析表明,“教育水平和收入并不能预测一个人是否会参加暴乱”。换句话说,人们参加暴乱,并不是因为他们失业;他们之所以参加暴乱,他们中的很多人说,是因为他们对种族主义问题很愤怒。

梅耶后来这么解释为什么要使用调查和电脑来回答谁参加了暴乱这个问题:

一个记者在和街上的人们进行交谈时,会几乎无意识地凭直觉作出比较。但牵涉到很多人(底特律暴乱调查对 437人做了采访)时, 直觉并不够,需要电脑对这么多人的想法进行计算、归类和分析,而且输入的信息必须是按一贯的标准整理过的。

梅耶的报道中没有数据可视化。相反,数据被用来作为证据,证明当时盛行的有关暴乱者的看法是错误的。

不同类型的数据新闻

Infographics 信息图

最简单的可视化是一个静态图片。此类可视化的一个优势是可以用在印刷品上。

Data Journalism Manual - Introduction 4

有的可视化是为了伴随文字报道,但“信息图”的设计目的是用一张既有数据,又有文字的图片来呈现一个完整的故事。信息图通常包括更多的平面设计元素,以更悦目或有趣的形式呈现信息。

Data Journalism Manual - Introduction 5

Video 视频

数据可视化也可以是视频形式,用于网上或电视。动画形式的数据呈现,可以既有旁白叙述又有复杂设计。这是有关美国收入不平等的视频中的一张截图:

Data Journalism Manual - Introduction 6

这是有关中国政协的视频:

Data Journalism Manual - Introduction 7

Interactives 互动图

有些报道需要互动性的数据可视化,即用户能够选择数据中的不同部分来看。这类互动图仍然有一个总体的报道或叙述,但用户通常可以只看具体和他们有关的数据。下面的互动可视化中,用户可以选择自己所在的州,来看他们当地同性恋者享有的法定权利。

Data Journalism Manual - Introduction 8

News Applications 新闻APP

设计得最好的互动式报道常常是和数据库相连的。这些报道有时被叫做新闻应用,来强调其可以让人们使用、而不只是被动呈现信息的特点。

下面的新闻应用让用户查看自己的医生从制药公司那里得到了多少钱。数据是从十多家制药公司按法律要求披露的几百页的文件中仔细整理出来的。

Data Journalism Manual - Introduction 9

下面是另外一个新闻应用的例子,是一个有关中国政治人物的数据库。用户可以看到有关每个政治人物的信息,还能以不同标准 - 从简单的年龄、性别、籍贯等,到高级和有趣或政治性的标准,比如有无在地方或沿海工作经验(此类工作经历在中国对于政治人物的职业生涯很重要)- 对其进行归类。尽管此应用中呈现的所有信息都是从公众可以获得的官方数据来源综合出来的,这样一种结构化的形式对用户来说更方便,也更吸引人。

Data Journalism Manual - Introduction 10

Teams and Workflow 工作团队和流程

要制作以上不同类型的报道,需要各种不同的技能组合。要找到、理解合适的数据,并将它和其它信息结合,需要传统的报道技能;而数据分析、可视化、以及APP的开发则要求统计学知识和编程技能;但没有好的设计,最终结果将不会吸引用户或会使他们感到不解。上述三方面构成了数据新闻的三个支柱: 报道、编程、设计。

一个人很难同时是以上三个领域的专家,所以,数据新闻通常都是由新闻编辑室里的一个团队来做的,团队中的每个人都专长一个领域。该团队也许是一个永久性的小组,或为了某个项目而临时组成。下面图片是“财新”的数据可视化实验室团队。

Data Journalism Manual - Introduction 11

不同新闻机构的数据新闻团队的名称不同。如果该团队的工作重点是通过对数据进行挖掘以找到故事,它也许会叫“计算机辅助报道”小组;如果重点是制作互动性应用, 也许叫“互动新闻”团队。有的新闻机构也许会就某个项目从不同部门抽调人员来组成一个临时团队。不同技能的组合要比团队的名称或部门重要的多。好的数据新闻要求好的报道、程序和设计。

不同新闻机构也会以不同的方式开始做数据新闻。有时数据团队的工作是由编辑按照机构总体新闻要求来布置的。这在既做印刷、电视,又做网上内容的大型新闻机构中很常见。举例来讲,在对一个大的故事进行报道时,编辑可能会布置数据团队来就同一则故事创作一个好的移动版。其它时候,数据团队要自己产生自己的报道内容。这时他们就需要向一个管理编辑“推销”自己的选题以得到批准,编辑也许就是数据团队的一个成员。

无论如何,有一点很重要,那就是要保证数据团队的成员不是唯一考察数据的人们。如果就某一题目有数据,任何对此题目进行报道的记者都需要对这些数据进行了解。数据团队的成员们在这方面可以为记者们提供帮助。

海外数据新闻的发展


点击进入下一章节:案例分析:幸福城市
想回到目录请点击这里

作者简介

数据新闻工作坊

数据新闻网以引介全球范围内最顶尖的数据新闻实践为初衷,以推动数据开放及媒体革新为宗旨,面向中国的新闻从业者、媒体管理者、新传教育者以及对传媒感兴趣的设计师、程序员,提供线上信息平台与线下交流机会。