新华网经验谈:多维度视角下的数据新闻

分享给朋友:

打虎拍蝇记

作者:新华网数据新闻部

文章以“学交互 | 多维度视角下的数据新闻—新华网数据新闻部实践经验谈”为题发布于新华网数据新闻部微信公号新据点(xinjudian001)。

01 一个古典的问题

说起“多维度”,恐怕没有人比3000年前的希腊人更能了解它的重要性了。其时他们刚刚摆脱了古埃及刻板而平面的范式,当他们观赏一座雕像的时候,他们可 以自由的观看不同的侧面,就像在真实世界里看到的那样,而无需像古埃及人那样,永远只能看到侧面的眼睛、正面的肩膀、里侧的胳膊和外侧的手。

时至今日,虽然已经无需再讨论埃及式和希腊式的表现手法孰优孰劣的问题,我们仍然可以从希腊式和埃及式中看到描述和表现复杂问题时的两种基本思路。

自从新闻学诞生以来,如何讲故事(story-telling)就是一个至关重要的核心问题,具体到数据新闻来说,就是如何使用、组织、并且表现数据。

我们可以选取埃及式的手法——找到新闻最具特点的一个切面作为故事主线,同时也可以学着像古希腊人那样思考,试着将不同视角的数据组织起来用以说明一个问题。

02 多维度的必要性 ——为什么我们要在数据新闻中引入多维度的概念

首先,新闻本身就是多维的,试着把新闻想象成一个多面体,我们可以发现下面这些事实:

  • 新闻事件本身具有丰富的多面性,我们很难只窥其一面就掌握全部的事实;
  • 新闻有其特有结构,使一件新闻区别于另一件新闻, 结构不同,特征各异;
  • 新闻事件受周围大环境的影响,同时又反过来影响周围环境。

新闻本身的多维属性给多维度的新闻报道方式留下了需求和空间。

另外,从数据新闻这一新兴起的新闻门类自身的特点和要求出发,多维度的报道方式也是必要的,我们要以数据为素材创作这样一种新闻作品:

  • 准确的(Accurate): 通过数据的挖掘、分析和可视化,去呈现新闻事件背后的事实和真相,提供准确而全面的信息,回避造成片面的歪曲和误读。
  • 深度化的(In-depth): 最终目的不仅是更轻松的理解信息,还包括将孤立、片面的信息组织起来,找出相互之间的关联点,从而使读者深度的掌握信息,获得新的知识。

长期以来,从一个侧面切入讲述新闻故事似乎都是记者和编辑们讲述新闻故事时一条必须遵循的不成文的“金科玉律”,但数据新闻的出现以及计算机辅助报道的尝试带来了新的视角、方法和技术,正在逐渐挑战这条定律的权威性。

就像 Giorgia Lupi在《The Architecture of a Data Visualization》一文中所说的那样,现在我们或许无需再畏惧新闻的多面化和复杂性,相反的,我们要“Embrace Comlexity”—— 大胆拥抱复杂性。

03 从实战经验谈数据新闻的多维度建模和表现

新华网从2012年开始对“数据可视化”新闻进行探索,是国内外较早开展数据新闻实践的媒体机构之一。以“用数据传递独特新闻价值”的理念,在数据梳理、表现形态、传播路径等方面进行创新,将枯燥内容生动化、将抽象概念具体化、将新闻信息知识化,力争在一件数据新闻作品中,就能让受众快速了解新闻事件的发展、演变,掌握新闻中的知识化内容,让新闻更有价值,用网民认可的新形态报道方式影响人。

数据建模 —— 探索、选择和组织数据 

提取中纪委网站“案件查处”栏目中落马官员的数据,将数据集进行进一步分析后整合为【时间和地域、年龄和级别】四个两两交叉关联的数据维度。

其中,时间和地域维度集中展现了中纪委通报的落马官员数量在2012年至2014年间,每个月份的数量峰值变化及各省份落马官员比例的变化,峰值变化用曲线表现,而省份比例的变化在地图上呈现,颜色越深的地域代表落马官员越多。这是两个现实可感的数据维度之间的组合,展现了反腐工作成果的现实图景。

年龄和级别维度的组合从一个更为抽象的角度对落马官员的个人资料数据进行了分析和挖掘,通过动态的聚类效果展现了落马官员级别、年龄的比例关系,并通过可视化的方式探索了级别和年龄两个维度之间相互的关联度。

在最后提供给读者的是一个可视化的数据检索工具:读者最多可以在姓名、年龄、级别等多个选项中选择四个搜索关键词,符合关键词的官员数据将会高亮显示。

45名日本战犯侵华罪行自供

侵华罪行: http://fms.news.cn/swf/zhanfan/

这是一个文本可视化的案例。由中央档案馆公布的45名日本战犯的罪行自供是极为珍贵的历史资料,我们尝试将这份以文本为主的资料以交互地图这种更直观的方式呈现出来。

交互地图分为两种维度,全景维度以地点为线索,统计了在《自供》出现的所有罪行种类。读者既可以查看日军战犯在每一省份所犯下的罪行,也可以通过点击左侧工具栏查看每一类罪行所涉及的省份。全景维度为资料的解读提供了一种鸟瞰式的、宏观的视角。

个人维度则是资料解读的微观视角,如同细胞一样,是整个交互页面的基础组成部分。以每一个战犯的个人信息为线索。通过点击全景地图上的坐标, 得到相关的战犯名单,即可从全景地图切换到个人地图。个人地图呈现了战犯的个人照片、简介以及犯罪轨迹图。

建模方法

在新闻数据的建模方式上,我们借鉴了Data Mining中“数据立方体”(data cubic) 的概念,将新闻事件结构为一个立方体,这个立方体由数据和信息组成的,包含不同的维度和角度,维度的选择和组合符合新闻传播的需要和叙事特点。通常我们根据下面两个原则进行数据维度的选择和组合:(1). 数据维度之间具有强相关性,这种相关可能是正相关(/ /),也可能是负相关的(/ \)。如《打虎拍蝇记》中,落马官员的年龄比例和级别比例呈现强烈的正相关关系,级别越高,年龄构成就越大——国级副国级主要由40后构成,省部级和厅局级落马官员中50后是主体,而县处级中主要是60后群体。《时间线上的色彩》中事件发展节点和社交媒体关注度的 峰值变化也呈现明显的相关关系。
(2). 单独一个维度过于单薄,两个以上维度结合在一起才能更好的说明问题。

如《打虎拍蝇记》中对时间、地域、落马官员数量三个维度进行整合,相互关联,形成一幅跨越时间和空间的图景。

数据表现 —— 多维度的表现数据

65周年·乐章

将国家65年间的GDP、进出口总值、人口结构、人均收入等宏观数据使用交互图表和音乐两种形式表现出来,将听觉和视觉结合,在数据可视化的同时,实现数据可听化

音乐由数据自动映射产生,配合辅助动态图表描述数据随着时间变化的过程,音乐的表现形式有GDP部分(第一部分)出现的一串连续的单音符,也有进出口部分(第二部分)和人口结构部分(第三部分)出现的音符组连续播放的形式。

音乐元素在数据新闻中的运用增加了另一维度的表现力和描述数据的效果,对视觉上的表现进行了补充。

多维度数据表现需要注意的问题 —— 维持整体感和统一性

(1)规划好整体的视觉框架,好的视觉框架可以在维持视觉及动态效果流畅、稳定的同时,对数据的结构和维度组合有所体现,能够激发用户对新闻数据进行进一步探索的欲望,并合理引导用户的探索。

(2)用恒定的基础视觉元素进行整个交互页面的统一。
《打虎拍蝇记》中,蜂窝形状是最基本的视觉元素,用来表示每一个落马官员,从而使整个页面不同的功能区在视觉上达到统一。

(3)当数据或视觉复杂度比较高的时候,从多个特征中抽取出主要的一个进行放大和强调,来完成表现上的张力及整个页面的统一。
《时间线上的色彩》视觉表现的灵感来自于安藤忠雄的光之教堂(省去其他不必要的功能及部分,通过墙体上的镂空十字架强调光的效果),将色彩作为一个独立的表现元素抽取出来,成为表现数据和整合页面的主角。

作者简介

数据新闻网

数据新闻网以引介全球范围内最顶尖的数据新闻实践为初衷,以推动数据开放及媒体革新为宗旨,面向中国的新闻从业者、媒体管理者、新传教育者以及对传媒感兴趣的设计师、程序员,提供线上信息平台与线下交流机会。