PastPages:新闻网站的另类存档

分享给朋友:

是什么让我们对纸张念念不忘?也许是永恒。

我可以翻出100年前某一天纽约时报的头版,那张新闻纸也许躺在档案馆或图书馆的某个角落、也许已被扫描成电子版网上可查。可是如果我们试图找出几年前某一天随便一个新闻网站的首页,似乎难于登天。互联网这个媒介可以做出很多有意思的东西,可是它似乎无法永恒。几年前做过的项目可能因为技术更新早就不能展示当时的设计,新闻网站也是一样,每天的首页更新不断,如何截取它本身的变化?

于是,Past Pages来了。

screenshot-www.pastpages.org 2014-12-21 17-24-19

Past Pages由洛杉矶时报数据记者Ben Welsh开发,每隔一小时自动截取世界各大新闻网站的首页图像,目前收录的我国网站是财经和新华网。使用它的API可以对任何网站做同样的事情。Ben前几周回到母校密苏里大学新闻学院,介绍和Past Pages一同推出的StoryTracker系列工具。

视频链接:http://youtu.be/U9TVHr3j0ws (需翻墙)

Past Pages开源地址:https://github.com/pastpages/pastpages.org

可以想见,这个工具对于研究者而言会非常有用;另一个潜在功能,也许是不用科学上网就可以扫读纽时首页?

*12月更新:ProPublica关于防火墙的新项目(英文版:https://projects.propublica.org/firewall/;中文版:https://projects.propublica.org/firewall/?locale=zh)就采用了Past Pages来展示各大外媒网站首页在防火墙内的屏蔽情况,也许对如何使用此类开源工具会有所启发。