以下文章归档于:「数据新闻手册」

中国数据新闻工作坊培训手册第一章 – 案例分析:幸福城市

特约撰稿 周优游 项目背景 “新一线”是《第一财经周刊》下的内容品牌栏目,通过公司数据挖掘城市对年轻人的吸引力,在二三线城市中寻找新的一线城市,给中国城市排名。2015年夏天,新一线已经启动两年有余,不定期以纸版杂志榜单专题或特刊形式呈现。这次负责项目的沈从乐找到我,说这期在杂志外,想要尝试点新东西… 继续阅读

中国数据新闻工作坊培训手册第二章 – 获取数据(视频)

在和国内的记者谈数据新闻的时候,最常遇到的问题就是:没有数据。 但这个“没有”的情况,又其实是多种多样的。有的是真的完全没有搜集,有的是有有关部门在搜集,但是并不完整或者许久不曾更新;又或者有多个部门在搜集,但彼此的方法和结果都有冲突;还可能是搜集方法古老,没有电子化;亦或者电子化了,但是没有做成易… 继续阅读

中国数据新闻工作坊培训手册第二章 – 实操:获取数据

搜索指令 谷歌、百度这些我们每天都用的搜索引擎,你真的会用吗? 例如:请在环保部网站上找到过去两年内的PDF格式的空气污染数据,你可以在三秒钟之内得到结果吗? 下面介绍一些最常用的指令 1) 双引号 “” 作用:完全匹配搜索,即搜索结果包含双引号中出现的所有词,连顺序也必须匹配 适用:谷歌,百度 实… 继续阅读

中国数据新闻工作坊培训手册第三章 – 实操:Excel基本技能

第一部分 – 单元格中的公式 通过这个动手实践活动,你会学到一些几乎每个数据新闻项目都会用到的基本的Excel技能。 先从你的样品数据文件里载入 世界主要城市空气污染状况_EN&CN.xlsx。该文件来自data.stats.gov.cn/lastestpub/gjnj/2013… 继续阅读

中国数据新闻工作坊培训手册第一章 – 数据新闻简介(视频)

什么是数据新闻 人类社会中数据无处不在。政府收集数据,公司产生数据,每个个人在网上也都留下了一长串的印迹。数据可以就社会和环境的状态提供详细准确的信息。这也正是新闻工作者必须能够懂得数据、并以数据传达信息的原因。 但大多数新闻工作者并没有数据方面的培训。在我们社会中,使用数据所要求的知识和技能(比如… 继续阅读

中国数据新闻工作坊培训手册第三章 – 实操:Excel进阶技能

此练习基于Investigative Reporter and Editors – IRE 的Jaimi Dowdell所编写的材料更改而成 我们来使用世行数据WorldBank.xlsx进行练习,提高分析速度和准确度。 使用筛选功能来迅速找到信息 看一下在“Ineligibility … 继续阅读

中国数据新闻工作坊培训手册第四章 – 数据可靠性和数据清理

虽然网上有很多免费数据,你经常会发现,这些数据并不是你需要的格式。这是数据新闻工作者常常面临的一个挑战。事实上,做数据新闻项目时,大部分时间常常都花在了获得准确、可靠并是可用格式的数据。本章探讨评估数据可靠性、保证数据干净可用方面的常见问题。 保证数据干净和可用的过程就叫数据清理。 这是从美国使馆空… 继续阅读

中国数据新闻工作坊培训手册第五章 – 数据新闻编程基础

为什么要编程 编程的意思是写电脑程序。电脑程序是通过一种叫做电脑“代码”的语言而给予电脑的一系列详细指令。 编程对于很多不同的数据新闻任务都很有用。本章我们重点关注通过编程来从一个网站的很多网页上收集数据,这个过程叫做“网上数据抓取”。你可以到每个网页上去复制然后再黏贴这些数据,但此过程可能需要几个… 继续阅读

中国数据新闻工作坊培训手册第五章 – 实操:Python简介

这是对Python基础命令的一个介绍。你需从python.org安装Python 3.4或更新的版本。老版本(比如 Python 2.7)不行。 要打开Python, 找到 IDLE (Python 3.4 GUI) 程序 你就会看到一个这样的窗口: 这是Python 立即执行你给与的任何命令的窗口… 继续阅读

中国数据新闻工作坊培训手册第五章 – 实操:用Python抓取数据(二)(视频)

做过从网页抓取元素的基本练习后,我们现在要把数据抓取程序扩用到几百个网页,从其中每个网页上的表格抓取干净的数据。 先到上次大家用过的程序: 运转此程序,产生的内容结尾部分应当如下: find命令会找出符合你标明的标签, id 或class的第一个东西。findAll找到所有符合你要求的东西。它会产生… 继续阅读