「2015 OpenVis 会议系列之一」数据科学家和他们的可视化工具

分享给朋友:

[zilla_alert]OpenVis会议是美国数据可视化业内的年会之一。本系列文均为原创,转载请注明出处、网址与文章作者。更多本系列文章:

【2015 OpenVis会议系列开篇】OpenVis 是个什么会

【2015 OpenVis会议系列之二】如何用可视化来讲故事

【2015 OpenVis会议系列之三】SVG, Canvas 和 WebGL 之比较

【2015 OpenVis会议系列之四】我们的地球美不美[/zilla_alert]

本文介绍 OpenVis 中的两场主题演讲。

可视化工具的重要性不言而喻。对于数据可视化从业人员而言,最基础的是能够使用已经存在的工具进行可视化的能力;有一些技术积累的从业者可以写教程指导某个可视化如何实现;能力更进一层者,可以对已有的可视化工具做出补充;而如果说最终目标,应当是新工具的创造。

如果说创造新工具的野心还不够大——写一个库也叫创造一个新工具 —— OpenVis 上有很多类似的开源库的介绍,那么当这个专为数据可视化服务的新工具可以自成体系、形成平台且还开源,其开发者也是理所应当地成为两场最受瞩目的主题演讲的主讲人。

二者分别介绍自己开发工具背后的理念、工具的特性、一些实际应用和仍然存在的问题。

年仅36岁的 Jeff Heer 现任华盛顿大学教授,曾任斯坦福教授,是D3开发者Mike Bostock做博士生项目 (D3前身) 的老师,数据咨询公司 Trifacta 的创始人之一。

演讲中,他首先把可视化工具根据方便使用程度分成三类:第一类是完全不需要接触代码、点击生成图表类型就可以生成相应图表的制图工具(Charting tools: Excel, Many Eyes, Google Charts),第二类是根据代码指令描述绘制相应图表的描述性编程语言(Declarative language: ggplot2, Protovis, D3),第三类是和电脑绘图系统沟通搭建起的计算机工具语言(Programming toolkit: Prefuse, Flare, VTK, Processing, OpenGL)。他的研究方向致力于开发第二类——描述性语言的可视化工具。

Heer主要介绍了他和学生们正在开发的可视化工具系统,包括D3简化版新工具vega、基于vega的统计绘图工具Vegalite、Vegalite的图形界面Polestar,以及自动分析数据生成多种图表类型的工具Voyager。而Lyra,是一个为不懂代码的设计师定制的,对Vega图表进行后期处理的工具。

Vega可视化工具生态系统

Vega可视化工具生态系统

讲稿PDF

上面提到的所有工具都是开源的,可以在这里找到。33分钟的讲座视频可在YouTube上观看。

Santiago Ortiz 是数据科学家,许多炫酷的探索性数据可视化都是他的作品,但他用的工具却鲜有人知【比如他自己的网站,是一整张canvas画布】。在 OpenVis 的主题演讲中,他介绍了自己使用的 Moebio 框架,并把基于此框架的平台 Lichen 开源。Moebio 框架是一个集合了多种数据模型的系统,而正在开源的Lichen平台是一个可以自由随便添加外来库、网页、音频来形成集合效果的 GUI 平台,其目的是实现工程师和用户的互动、看到及时效果。Lichen 正在开源中,你可以在这里订阅最新动态 。

The beauty of mixed code

The beauty of mixed code — Lichen

Santiago Ortiz 在会上提到,Moebio 框架的开发工作从2007年开始的,而D3的原型 Protovis 发布于2009年,如果算上两年的前期开发时间,项目起始也在07年左右。想来两位都用了八年时间对一个可视化平台进行不断的改善和拓展,而这个过程还没远没有结束。

 

4月16日最新更新:所有讲座视频都可以在会议官网上找到。

作者简介

周优游

数据新闻记者,交互设计开发,致力于讲当讲的故事,给更多人听。目前供职于美联社。