当前位置:动态 > 正文
环球视点!因为围墙花园和付费墙 互联网档案馆发现自己越来越难记录互联网
2022-10-05 05:59:28 来源: cnBeta.COM


(相关资料图)

自从互联网档案馆(Internet Archive)开始保存各种数字资料,包括软件、游戏、电影、图像,当然还有网页至今已超过26年。Wayback Machine是处理不断增加的收集和整理互联网快照任务的机制,自90年代中期以来,它已经取得了长足的进步。

我们可以把Wayback Machine想象成一台虚拟的时间机器。有了它,你可以回到过去,查看不同的网站在整个历史上的固定时间段的样子。在进行研究或事实核查时,这可能是非常有用的,而在记录网页设计技术多年来的演变时,也同样有趣。

Wayback Machine在成立短短一年后就成功地归档了2TB字节的数据,这在当时是一个巨大的数据量。如今,你可以把所有这些数据存储在一个30美元的U盘里,并把它放在你的口袋里随身携带。

今天,Wayback Machine的数据库中包含超过7000亿个网页,总容量接近100PB。不幸的是,这个非营利组织的工作并没有变得更容易,因为付费墙和围墙花园反抓取机制(如Facebook)正在使它越来越难以纪录互联网的样子。20年后,我们还有可能看到今天的社交媒体活动的记录吗?

再者,如果元宇宙像一些人预测的那样实现,互联网档案馆将不得不相应地发展其收集工作,或者因为某种原因无法对该数字媒体中发生的事情进行编目。

并非所有人都认为该组织有权做它所做的一些事情。当互联网档案馆在大流行病开始时推出没有等待名单的国家紧急图书馆时,一些出版商说这相当于故意大规模侵犯版权。互联网档案馆提前关闭了其紧急借阅图书馆,希望能避免一场昂贵的诉讼,但出版商还是提起了诉讼。7月,双方都提出了简易判决的动议。

访问:

阿里云 - 最高1888元通用代金券立即可用

标签: 通信技术 因为围墙花园和付费墙 互联网档案馆发现自己越

责任编辑: jkl2