以下文章归档于:数据可视化

NICAR2016会议总结

丹佛地处美国中西部山区,紧邻着著名的落基山脉,是天然的滑雪胜地,也是闻名全国的啤酒城。2016年三月初,有超过1200名媒体从业者来到这里参加一年一度的NICAR (全国电脑辅助性报道) 会议。 为期四天的会议包括了案例研讨 (panel) ,工具教学 (hands-on) ,灵感演讲 (light… 继续阅读

中国数据新闻工作坊培训手册第四章 – 实操:使用Open Refine清理数据

本教学材料部分根据 http://enipedia.tudelft.nl/wiki/OpenRefine_Tutorial 改编。你可以到此网址了解有关 Open Refine 的更多情况。Open Refine 以前叫 Google Refine, 所以你在搜索信息时也可以用Google Refi… 继续阅读

中国数据新闻工作坊培训手册第五章 – 数据新闻编程基础

为什么要编程 编程的意思是写电脑程序。电脑程序是通过一种叫做电脑“代码”的语言而给予电脑的一系列详细指令。 编程对于很多不同的数据新闻任务都很有用。本章我们重点关注通过编程来从一个网站的很多网页上收集数据,这个过程叫做“网上数据抓取”。你可以到每个网页上去复制然后再黏贴这些数据,但此过程可能需要几个… 继续阅读

中国数据新闻工作坊培训手册第五章 – 实操:Python简介

这是对Python基础命令的一个介绍。你需从python.org安装Python 3.4或更新的版本。老版本(比如 Python 2.7)不行。 要打开Python, 找到 IDLE (Python 3.4 GUI) 程序 你就会看到一个这样的窗口: 这是Python 立即执行你给与的任何命令的窗口… 继续阅读

中国数据新闻工作坊培训手册第五章 – 实操:用Python抓取数据(一)(视频)

大多数人先学创建网页,然后才学拆解网页,但数据新闻工作者却恰好相反。在本练习中,你将学习如何确定一个网页的内部结构,并通过Python 来抓取其中数据。 我们将使用来自环境保护部的一个页面。 使用FireFox到这个URL: http://datacenter.mep.gov.cn/report/a… 继续阅读

中国数据新闻工作坊培训手册第五章 – 实操:用Python抓取数据(二)(视频)

做过从网页抓取元素的基本练习后,我们现在要把数据抓取程序扩用到几百个网页,从其中每个网页上的表格抓取干净的数据。 先到上次大家用过的程序: 运转此程序,产生的内容结尾部分应当如下: find命令会找出符合你标明的标签, id 或class的第一个东西。findAll找到所有符合你要求的东西。它会产生… 继续阅读

中国数据新闻工作坊培训手册第五章 – 如何学习更多编程知识和技能

要想学更多编程知识和技能,有很多办法。关键的两个原则是:1)要在一个社区里学;2)永远不怕搜索答案。 完全自学编程非常难。幸运的是,想学编程的人很多。大多数城市里都有社区编程小组和活动,网上还有编程课程,选修这些课的学生之间会互相帮助。两个编程新手合作来解决一个问题可能会很有效,因为每个人都会看到对… 继续阅读

中国数据新闻工作坊培训手册第六章 – 诠释数据(视频)

数据经常被看作是科学的,被认为是“真理”,但事实并非如此。数据之所以产生,是因为我们试图把周围复杂的世界转变为数字。尽管这是理解世界的一个强有力的方式,但在你了解数据来自何处、衡量什么、对谁重要以及为什么重要之前,数据并没有任何意义。了解数据的这一过程就叫做对数据的诠释。 新闻报道经常使用GDP(国… 继续阅读

中国数据新闻工作坊培训手册第六章 – 因果关系(视频)

接着上一章的讨论,这一部分探讨这样一个问题:“数据中真的有一个故事可以报道吗”?具体来讲,当我们从数据中发现一些联系或规律的时候,我们要去看有哪些不同的途径来解释。 我们先对一个网上约会站点的信息做一下分析: 数据来自OKCupid这一网站,显示的是女性对男性发给她们的帖子的回复率。平均回复率为1/… 继续阅读

中国数据新闻工作坊培训手册第七章 – 可视化原则和基础

不是每个数据报道都需要可视化,但可视化的确很受人们欢迎,是传达信息的一个好方法!在本章中,我们将试图提供一些创作好的可视化的基本原则。 设计一个可视化时你必须重点考虑三个方面:数据呈现、平面设计、以及互动。科学家们通常只考虑对数据的呈现,即如何在屏幕上显示数据。但是,我们也必须关心呈现的外观,即其是… 继续阅读