「2014 NICAR系列之四」一览无遗:数据新闻资源

分享给朋友:

[zilla_alert]今年三月初,一年一度的新闻骇客盛会NICAR(全称:The National Institute for Computer-Assisted Reporting,即美国计算机辅助报道协会)在美国巴尔的摩举行。在201年NICAR会议系列报道中,亲临现场的数据新闻网作者们共同这一数据新闻领域的重要会议。

本系列文均为原创,转载请注明出处、网址与文章作者。

更多本系列文章:

【2014 NICAR系列之一】 新闻界极客的聚会
【2014 NICAR系列之二】没有数据怎么办?
【2014NICAR系列之三】新闻应用,静态页面VS动态页面
【2014  NICAR系列之四】一览无遗:数据新闻资源
[/zilla_alert]

2014年NICAR数据新闻年会为历届之最,吸引了近千名与会人士参与。为期4天的会议涵盖了数据新闻工具、编程语言培训,数据新闻未来走向探讨和资深媒体人分享经验等诸多方面的内容,同时,年会每天都安排了诸多平行分会场,与会者都面临选择的困惑。庆幸的是,在纽约时报担任Developer Advocate一职的资深媒体人Chrys Wu收集了年会所有主讲人的讲义、幻灯片及分享视频等资料,与感兴趣的人士分享。

编辑按:本篇共有五个部分,比较长,可以概览后搜索关键词;每年都有很多新工具诞生,网上的资源也十分丰富,然而结合实践才能学习和日渐熟悉这些工具,卡壳的时候不妨回来翻阅一下数据新闻网为您整理的这份清单,以及网站上标签分类下的其他资源,如点开实战查看中文媒体接地气的原创作品,DJ半月刊查看数据新闻前沿作品动态。

一、主题及讲义

1、如何制作人生第一个APP?   by Ben Welsh (《洛杉矶时报》数据编辑)

2、如何用leaflet和mapbox.js制作在线地图?  by Becca Aaronson

3、制作在线地图的原则、常见错误,以及开发潜力 by Noah Veltman & Tom MacWright

4、Excel魔法课   by MaryJo Webster  讲义数据

5、50分钟50个观点分享   by   MaryJo Webster

6、如何用R语言制作在线地图和图表(以新闻实践为例) by Matt Waite

7、MySQL系统介绍  by Liz Lucas (IRE/NICAR数据库编辑)

8、开源程序PostGIS和地图绘制工具CartoDB  by Michael Keller & Andrew Hill

9、揭秘D3:关于图形语言的程序  by Alastair Dant

10、d3.js的简介  by Irene Ros

11、揭秘d3.js  by Irene Ros

12、学习简单编程知识(Python) by Agustin Armendariz

13、亚马逊云计算基础  by Scott Klein (ProPublica)

14、如何从网上抓取数据   by Scott Klein

15、数据可视化工具Tableau简介   by Jewel Loree

16、如何通过命令行操作SQLite  by Matt Kiefer  PPT源代码

17、美国国家公共电台应用程序模板  by Tyler Fisher (NPR视觉团队)

18、洞察力和启蒙——新闻可视化的未来  by Alberto Cairo (迈阿密大学传播学院教授)

Alberto Cairo还附上了在Tapestry数据报道会议(TDSC)上讲授的题为“视觉艺术——可视化与普通受众的交流”的PPT

19、数据驱动报道(笔记) by Stephen Suen

20、Data-Driven Story: Putting the Package Together by Maud Beelman

21、“珍爱生命,让你的服务器退休”  by Andy Boyle & Tasneem Raja

22、Getting Started with Excel  by Helena Bengtsson

23、以可视化分析工具NodeXL进行网络分析   by Peter Aldhous

24、Investigating Racial Inequality in Your Region   by Lawrence Lanahan

25、Mapping 1: displaying geographical data with QGIS  Hands  by Peter Aldhous

Mapping 2: Manipulating geographical data with QGIS

26、Counting and Summing with SQL   by Andrea Fuller (原《今日美国》、现WSJ数据记者)

27、Digging online for global data   by Jonathan Stoneman

28、挖掘普查数据(Mining the Census for Every Beat)by Ronald Campbell

1)分析普查数据必备的资料   by Paul Overberg (《今日美国》数据编辑、人口普查数据资深记者)

2)处理人口普查中关于通勤的数据 by Mike Maciag (Governing.com 数据编辑)

3)ACS: A Growing Ecosystem  by   Paul Overberg

29、数据深度挖掘  by   Paul Overberg

30、免费的计算机辅助检索工具  by Matt Wynn & Martin Burch

31、如何利用群众的力量     by Robert Benincasa(美国国家公共电台制片人、计算机辅助报道记者)& 美国国家公共电台(半岛电视台数据记者)PPT讲义

32、网页抓取数据前应该考虑什么问题? by Isaac Wolf(Scripps News记者)

33、破解PDF文件的工具   by   Jeremy Merrill (《纽约时报》互动新闻开发人员)讲义源代码

34、如何使用微数据进行定制调查 by Robert Gebeloff (《纽约时报》数据分析人员)PPT源代码

35、通过数据调查挖掘商业报道   by Rob Barry(《华尔街日报》调查记者) & Philip Mattera(政府资料中心Good Jobs First研究总监  )

36、如何用数据提升报道水平     by Steven Rich(《华尔街邮报》调查数据库编辑) & Rob Barry (《华尔街日报》调查记者)

37、Mining Health Care Data    by Peter Eisler (《今日美国》医疗卫生领域数据记者)

38、如何用图片、文本和ArcGIS制作数据地图     by Sharon Machlis(Computerworld网络总编辑)

39、R语言简介初学者入门指导    by Sharon Machlis

40、公共卫生数据库资源     by Charles Ornstein(ProPublica高级记者)

41、ProPublica如何做公共卫生报道? by Charles Ornstein

42、GitHub简介   by Jordan McCullough

43、如何用GitHub合作写报告   by Ben Balter

44、挖掘非营利性数据     by Kendall Taggart(The Center for Investigative Reporting数据记者)

45、Complaints: A road map for killer investigations & State Consumer Complaint Contacts

By Tisha Thompson & Jill Reipenhoff

46、A Reporter’s Guide to Unleashing E-Docs  by Deborah Nelson

47、Learn how to use Census Microdata  by Katie Genadek

48、数据可视化  by Chris Amico(记者、网页开发人员), Lena Groeger(ProPublica新闻应用开发人员) &  Ryan Pitts(Census Reporter成员)

49、追踪罪案    by Laura Norton Amico (Chris和Laura夫妻档共同维持首府华盛顿他杀追踪数据库Homicide DC)

50、体验一把黑客     by Samantha Sunne(美国国家公共电台调查组实习生)

51、挖掘联邦选举委员会数据   by Chris Schnaars(《今日美国》数据库编辑)

52、如何通过视觉呈现讲故事  by Chrys Wu(《纽约时报》Developer Advocate)、Helene Sears(BBC视觉新闻团队成员)、Aron Pilhofer(《纽约时报》数据战略副主编、《卫报》数据工作执行主编) & Alyson Hurt(美国国家公共电台图像编辑)

53、如何用自制传感器进行报道  by Team Blinky

54、编程语言Ruby介绍  by Al Shaw(ProPublica新闻应用开发人员)

55、网页抓取的技巧和工具   by Nils Mulvad (Kaas & Mulvad编辑)

56、如何花20美元制作一个警用扫描仪——软件无线电(SDR)介绍 by Ken Schwencke(《洛杉矶时报》记者和程序员) & Jon Keegan(《华盛顿邮报》交互图像负责人)

57、如何用PANDA Project处理数据  by Christopher Groskopf(美国国家公共电台可视化团队开发者)

58、如何用数据强化传统天气报道  by Stephen Stirling & Ian Livingston   讲义PPT

59、如何用OpenRefine清理数据  By Frederick Kaimann

60、如何为自己的报道进行安全规划? by Jonathan Stray(美联社)视频PPT

61、《华盛顿邮报》如何对聊天过程进行加密?   by Jennifer Valentino(《华盛顿邮报》调查记者)

62、Python迷你训练营   by Tom Meagher

63、Python入门  by   Anthony DeBarros (Gannett Digital数据可视化团队负责人)

64、如何对Python 程序进行重构?(Intermediate Python: Refactoring 101) by Jeremy Bowers、Serdar Tumgoren & Katie Park   讲义源代码1源代码2

65、什么是数据工作室?  By Ben Welsh (《洛杉矶时报》数据编辑)

66、新闻编辑室中如何进行沟通? By Stephen Suen

67、卫星图像云端运算平台Google Earth Engine介绍  by Vanessa Schneider

68、数据深度挖掘  by Ellen Gabler、John Maines、Paul Overberg

69、学习RegEx  by Amanda Hickman (regular expression)

70、如何使用Mapping Toolbox绘制地图? By Michael Corey & Ryan McNeill

71、绘制地图和展示   by John Keefe & Chris Amico

72、如何去除人口普查地图中的水域空间? By John Keefe (WNYC数据组负责人)

73、运用Tabula抓取PDF文件上的信息   by Jeremy Merrill (《纽约时报》)

74、如何追踪危险的废料?  By Ben Poston(《洛杉矶时报》)

75、如何运用社会化媒体进行调查   by Mandy Jenkins & Robert Hernandez

76、如何打造Twitter“僵尸大军”   by Joe Kokenge、Abraham Epton、Brian Abelson

77、如何将图表连接实时数据? by Timothy Barrmann   PPT案例源数据

78、如何做政治献金报道?     By Jack Gillum(美联社)

 

二、软件及工具

1、竞选资金分析工具   by   Aaron Bycoffe(《赫芬顿邮报》网页开发者、记者)

2、数据开源及处理工具平台Computational Journalism on a Stick  by  M. Edward Borasky

3、政府信息公开申请网站 FOIA Machine

4、信息公开申请网站 What Do They Know     by UK FOI

5、云计算系统 Wakari.io

6、地理编程信息库 Oatmeal geocoded

7、交互式地图制作工具 Kartograph

8、数据清洗(data cleaning)工具 OpenRefine

9、数据可视化、交互制作工具 Miso Project

10、可重复使用d3.js图表制作工具 D3.chart

11、摆脱结构文本限制运行SQL的工具 TextQL

12、股市走势分析工具 Rank and Filed

13、在线文件转换器 CometDocs

14、网页抓取工具  Import.io

15、追踪跨国非法交易工具 Investigative Dashboard

16、从纸质表格和PDF文件中提取笔迹工具 Captricity

17、调整Excel数据插件 Tableau plug-in

18、检测浏览器安全性在线工具 Panopticlick

19、Wifi硬件开发面板 Spark.io

20、加密工具 GPGTools

21、谷歌账户加密

22、用Equation制作计算器  by Sisi Wei & Steven Melendez

23、费城周边区域学校课本存量监测工具 Stacked Up

24、政客、媒体歧视性行为查找工具 Shut That Down

25、Sunlight基金会数据API Sunlight Foundation APIs

26、美国人口调查局普查数据使用工具 Census Reporter

27、 加拿大,英国,德国,冰岛,挪威,瑞典和美国等国人口普查数据库 IPUMS

28、美国2010年人口普查数据检索项目US2010  by Brown University

29、网站跟踪工具 Website Watcher

30、查找电话号码工具:AnyWho (美国)、InfobelNumberway (美国以外地区)

31、搜索Tweets工具 Snap Bird

32、Twitter分析工具 Foller.me

33、Twitter影响力分析工具 Analytics

34、Twitter分析工具 Tweetbeep

35、提升下载能力工具 DownloadThemAll

36、美国国家公共电台应用程序开发模板 Apps Template

37、简便网络发布平台 Tarbell

38、可视化语法 Vega

39、可视化设计平台 Lyra

40、文本分析工具 Overview Project

41、开源软件 Open Source Alternative

42、抓取CSV格式文件信息工具 Tabula

43、反向图片搜索工具 Tineye

44、人肉搜索强化工具 Falcon

45、加密通讯软件 Cryptocat

46、防网络监控和流量分析 Tor Project

47、保存保存截图和网站源代码工具 freze

47、交互式、非线性作品制作开源工具 Twine

 

三、参考资料

1、IRE-NICAR数据库

2、迈阿密大学传播学教授Alberto Cairo的博客 The Functional Art

3、《纽约时报》图像编辑Mike Bostock 关于如何制作在线地图的教程

4、设计师Mike Monteiro一场 关于“设计师如何摧毁世界”的演说

5、Leland Wilkinson等人编写的 《图形语法》

6、加州大学洛杉矶分校(UCLA)统计学博士Nathan Yau的博文 《如何阅读和使用直方图》

7、UCLA数字化研究和教育研究所(IDRE)的 “如何挑选统计分析方法”资料

8、俄勒冈大学经济学教授Mark Thoma 的 计量经济学讲座课程资料

9、Fracking tipsheet   by Mike Soraghan

10、美国州政治开支研究中心档案网站

11、莱斯大学统计学助理教授Hadley Wickham撰写的论文《如何令数据变得整洁》 (Tidy Data)

12、Andrey Sitnik制作的缓动函数速查表(中文)

13、Tom MacWright编写的制作网络地图小抄

14、美国国会图书馆数字格式信息网站

15、旧金山大学设计学助理教授Scott Murray编写的D3.JS入门教程(中文)

16、环境记者协会制作的水坝、水库和堤坝资料数据库

17、ArcGIS网络地图图库

18、卫生智能机构(Health Intelligence)制作的世界死亡原因可视化分析论文 Causes of Death in the World. 1990, 2005, 2010

19、Pew皮尤研究中心Data Feed

20、Whitfield Diffie和Martin E. Hellman撰写的论文《密码学新方向》

21、Best practices for FOIA & government information requests (from Office of Government Information Services)

22、家庭教育权利隐私法执行情况研究项目 FERPA Fact

23、信息设计及数据可视化先驱人物Edward Tufte编写的 迷你图理论与实例分析书籍

24、由Tasneem Raja撰写的《Mother Jones》杂志地图制作案例分析 A Map That Wasn’t a Map

25、美国受害者通知网络 VINELink

26、美国人口失踪和身份不明搜索系统 NamUs

27、美国联邦监狱局(Federal Bureau of Prisons)的网上囚犯定位系统 Inmate Locator

28、联邦储备经济数据库(FRED)

29、哥伦比亚大学新闻学院Nick Diakopoulos撰写的《算法的责任报告》

30、谷歌论坛

31、美国国家历史地理信息系统

32、美国政府开放数据库Data.gov

33、如何通过Microsoft Word进行邮件合并?

34、如何以R制作等值线地图(Choropleth map)

35、微软研究中心Danah Boyd和Kate Crawford撰写的论文《向大数据发出的6大质疑》 (Six Provocations for Big Data)

36、纽约公共电台WNYC记者Noah Veltman解释 静态网站和动态网站的区别

37、如何打造数据科学团队团队  by DJ Patil

38、终极用户测试——请醉客测试移动应用程序

39、开发应用前,跟着美国国家公共电台视觉团队装配Mac

40、Stuart A. Selber撰写的《数字时代下的多模态识读》

41、BBC OpenNews团队成员Noah Veltman的 新闻编辑室Learning Lunches技术培训讲义

42、哈佛大学学者Gary King、Jennifer Pan和Margaret E. Roberts撰写的论文《通过随机试验和参与观察,逆向监督中国的审查制度》

43、Political Framing Blog应用计算机对美国国会修辞趋势进行的分析资料

 

四、5分钟演讲(Lighting Talks)

1、代码重构   by  Christopher Groskopf (NPR视觉团队开发者)

2、可视化作品鉴赏    by   Lena Groeger(Propublica科技记者、新闻应用开发者)

3、厨房中的自然语言处理 by  Anthony Pesce(《洛杉矶时报》新闻应用开发者、报道可视化和数据分析师)

4、5分钟5个运算法则   by  Chase Davis(《纽约时报》交互新闻助理编辑)现场视频

5、我们能从数据可视化中学到什么? by Katie Park(《华盛顿邮报》图像编辑)PPT现场视频

6、新闻微积分  by Steven Rich(《华盛顿邮报》调查新闻记者)

7、Detecting What Isn’t There  by Sisi Wei (ProPublica新闻应用开发者)

8、5分钟讲解整个互联网  by Jeremy Bowers(美国国家公共电台新闻应用开发者)PPT现场视频

9、如何招募一直军队?——以Knight Lab为例   by Tyler Fisher(新闻应用开发者)

10、你必须学习  by Ben Welsh (《洛杉矶时报》新闻应用开发者)PPT现场视频

 

五、作品范例

1、Planet Money Makes a T-Shirt      by  美国国家公共电台  源代码

2、交互作品和信息图   by  BBC News

3、美剧《吸血鬼猎人巴菲》可视化作品 (d3.js)

4、洛杉矶国际机场第三航站楼枪击案时间轴(KPCC)

5、寻找美国南加州连环枪击案嫌疑人Christopher Dorner时间轴(KPCC)

6、山火追踪 (KPCC)

7、1950年以来世界人口的变迁(Epoca)

8、美国LGBT群体过去50年中的人权变化((University of Wisconsin-Madison)

9、弄懂HealthCare(WSJ)

10、俄罗斯的可疑选举(WSJ)

11、数百名被枪杀儿童的肖像(Mother Jones)

12、无障碍儿童游乐场(NPR)

13、保密101(The Columbus Dispatch)

14、华盛顿:分离的世界(The Washington Post)

15、英国卫生机构的冬天:急诊监测(BBC News)

16、儿童交易(Reuters Investigates)

17、枪击案阴霾中的芝加哥(The Chicago Tribune)

18、致命延误(The Milwaukee Journal-Sentinel)

19、追踪龙卷风(Adam Pearce)

20、数据新闻菜鸟的第一个作品

 

Chrys Wu还整理了2011年、2012年和2013年NICAR数据新闻年会的相关资料,想了解地更多请戳这里

作者简介

王齐龙

关注时政、数据新闻。现供职于中国新闻周刊,从事国际新闻报道。