archive.is
archive.today,又称archive.is或archive.ph,是一个私人资助的网页存档网站,[3][4]数据中心位于欧洲法国的北部-加来海峡。[5]这个网站典藏档案馆使用Apache Hadoop与Apache Accumulo软件。它可以一次取回一个类似于WebCite的小于50MB的页面,并能收录Google地图与Twitter。
网站类型 | 网站典藏 |
---|---|
语言 | 多语言 |
网址 | |
注册 | 否 |
推出时间 | 2012年5月16日[2] |
现状 | 活跃 |
archive.is会根据著作权所有者的合乎数码千年著作权法案(DMCA)的撤除请求移除已归档的页面。[6]
它每次请求都会捕捉网页的文字内容,加载不含活动元素或脚本的Web 2.0网站或由JavaScript产生的图片与框架内容。截图是1024×768像素,没有弹出窗口。[7][8]
截至2015年,archive.is还支持了Memento项目的API,[9][10]并且开发了Firefox浏览器[11]与Chrome浏览器[12]的扩展。
屏蔽
在2015年7月21日,网站管理人员屏蔽了芬兰的IP地址,他们在其Twitter上声称,这么做是为了避免与芬兰政府的纠纷升级。他们拒绝提供额外的资讯。[13]此网站也被中国[14]与哈萨克斯坦屏蔽。此站同样被OpenDNS屏蔽。[15]
易名
archive.is曾多次更换域名。
从建站初期至2014年4月14日是使用“Archive.is”(首字母为大写)。
在2014年4月15日时,该网站的名称已更名为“archive.today”(首字母为小写)。[16][17]
在2015年春季又改回了“archive.is”(首字母为小写)。[18][19]
2021年夏季,此网站采用“archive.today”为标题,主域名替换为“archive.ph”。
使用案例
这个档案馆会被一些作者或骇客活动分子使用。
评论
有别于比如互联网档案馆时光机(Internet Archive Wayback Machine)的主动性网络蜘蛛,archive.is每次只捕捉网站的一个页面,所以不遵守“Robots排除标准”。 [24]
从法律上讲,archive.today与互联网档案馆时光机有很大不同。互联网档案馆的时光机抓取网页时遵循通常的Robots指令,这种指令可以阻止其抓取特定的网页。然而,网站无法阻止archive.today的用户对其制作站点镜像。
——Jason Koebler,Dear GamerGate: Please Stop Stealing Our Shit
参见
参考文献
- ^ Will you make a v3 onion site for Archive Today?. blog.archive.today. 2021-07-13 [2021-07-24]. (原始内容存档于2021-07-24).
- ^ Archive.is blog — When did the Archive-is site originally launch?
- ^ Pseric. Archive.is 線上備份網頁工具,可下載完整網頁內容或將畫面轉為擷圖. 免费资源网络社群. 免费资源网络社群. 2015-06-27 [2024-10-22]. (原始内容存档于2015-06-27).
- ^ Martin Brinkmann. Create publicly available web page archives with archive.is. GHacks. 2015-04-22 [2015-06-13]. (原始内容存档于2015-10-12).
- ^ archive.is status. Stat Radar. [2013-05-08]. (原始内容存档于2013-07-27).
- ^ "How can I delete an archived page?". [2015-07-17]. (原始内容存档于2015-07-21).
- ^ archive.today – webpage capture. archive.today. [2013-05-08]. (原始内容存档于2012-06-28).
- ^ archive.today FAQ. archive.today. [2013-05-08]. (原始内容存档于2013-04-20).
- ^ Nelson, Michael L. Archive.is Supports Memento. Research and Teaching Updates. Web Science and Digital Libraries Research Group at Old Dominion University. 2013-07-09 [2013-09-17]. (原始内容存档于2013-07-27).
- ^ "archive.is" (页面存档备份,存于互联网档案馆) Memento Protocol Information. Memento Development Group. Retrieved 17 September 2013.
- ^ Archiveror – Get this Extension for 🦊 Firefox (en-US). addons.mozilla.org. [2019-06-29]. (原始内容存档于2019-06-25).
- ^ archive.today Button. chrome.google.com. [2019-06-29]. (原始内容存档于2019-06-29).
- ^ archive.today. @FukBoyKuupe @atlasnodded I blocked proactively in order not to escalate as in recent Russia vs. http://archive.org case.. 2015-07-21 [2015-07-22]. (原始内容存档于2015-10-21).
- ^ archive.is is 100% blocked in China. GreatFire Analyzer. 12 August 2018. (原始内容存档于12 August 2018).
- ^ Jared. Even my school blocks http://archive.today , what the hell. 2015-07-24 [2019-06-29]. (原始内容存档于2018-12-28).
- ^ archive.is - webpage capture - Google 2014年4月14日 11:21:06 GMT (Peeep.usのキャッシュ (页面存档备份,存于互联网档案馆))
- ^ archive.today - webpage capture - Google 2014年4月18日 17:40:45 GMT (Peeep.usのキャッシュ (页面存档备份,存于互联网档案馆))
- ^ https://archive.today:443/ - 2015年3月22日 22:49 - ウェブ魚拓. megalodon.jp. [2015年7月19日]. (原始内容存档于2015年6月28日).
- ^ https://archive.is:443/ - 2015年5月14日 01:08 - ウェブ魚拓. megalodon.jp. [2015年7月19日]. (原始内容存档于2015年6月28日).
- ^ Koebler, Jason. Dear GamerGate: Please Stop Stealing Our Shit. 2014-10-29 [2019-06-29]. (原始内容存档于2019-06-29).
- ^ Julian Assange - When Google Met WikiLeaks. [2015-07-17]. (原始内容存档于2015-07-21).
- ^ user, Debian. Julian Assange - Google Is Not What It Seems. 2014-10-24 [2015-07-17]. (原始内容存档于2016-01-14).
- ^ US Army Official Website Hacked — Syrian Electronic Army. 2015-06-14 [2015-07-17]. (原始内容存档于2015-06-11).
- ^ Dascalescu, Dan. Web page archiving - Dan Dascalescu's Wiki (review). Wiki.dandascalescu.com. 2013-02-18 [2013-10-03]. (原始内容存档于2015-10-12).