archive.is
archive.today,又稱archive.is或archive.ph,是一個私人資助的網頁存檔網站,[3][4]數據中心位於歐洲法國的北部-加來海峽。[5]這個網站典藏檔案館使用Apache Hadoop與Apache Accumulo軟件。它可以一次取回一個類似於WebCite的小於50MB的頁面,並能收錄Google地圖與Twitter。
網站類型 | 網站典藏 |
---|---|
語言 | 多語言 |
網址 | |
註冊 | 否 |
推出時間 | 2012年5月16日[2] |
現狀 | 活躍 |
archive.is會根據著作權所有者的合乎數碼千年著作權法案(DMCA)的撤除請求移除已存檔的頁面。[6]
它每次請求都會擷取網頁的文字內容,載入不含活動元素或指令碼的Web 2.0網站或由JavaScript產生的圖片與框架內容。截圖是1024×768像素,沒有快顯畫面。[7][8]
截至2015年,archive.is還支援了Memento專案的API,[9][10]並且開發了Firefox瀏覽器[11]與Chrome瀏覽器[12]的擴充功能。
封鎖
在2015年7月21日,網站管理人員封鎖了芬蘭的IP地址,他們在其Twitter上聲稱,這麼做是為了避免與芬蘭政府的糾紛升級。他們拒絕提供額外的資訊。[13]此網站也被中國[14]與哈薩克斯坦封鎖。此站同樣被OpenDNS封鎖。[15]
易名
archive.is曾多次更換網域名稱。
從建站初期至2014年4月14日是使用「Archive.is」(首字母為大寫)。
在2014年4月15日時,該網站的名稱已更名為「archive.today」(首字母為小寫)。[16][17]
在2015年春季又改回了「archive.is」(首字母為小寫)。[18][19]
2021年夏季,此網站採用「archive.today」為標題,主域名替換為「archive.ph」。
使用案例
這個檔案館會被一些作者或黑客活動分子使用。
評論
有別於比如互聯網檔案館時光機(Internet Archive Wayback Machine)的主動性網絡蜘蛛,archive.is每次只擷取網站的一個頁面,所以不遵守「Robots排除標準」。 [24]
從法律上講,archive.today與互聯網檔案館時光機有很大不同。互聯網檔案館的時光機抓取網頁時遵循通常的Robots指令,這種指令可以阻止其抓取特定的網頁。然而,網站無法阻止archive.today的用戶對其製作站點鏡像。
——Jason Koebler,Dear GamerGate: Please Stop Stealing Our Shit
參見
參考文獻
- ^ Will you make a v3 onion site for Archive Today?. blog.archive.today. 2021-07-13 [2021-07-24]. (原始內容存檔於2021-07-24).
- ^ Archive.is blog — When did the Archive-is site originally launch?
- ^ Pseric. Archive.is 線上備份網頁工具,可下載完整網頁內容或將畫面轉為擷圖. 免費資源網絡社群. 免費資源網絡社群. 2015-06-27 [2024-10-22]. (原始內容存檔於2015-06-27).
- ^ Martin Brinkmann. Create publicly available web page archives with archive.is. GHacks. 2015-04-22 [2015-06-13]. (原始內容存檔於2015-10-12).
- ^ archive.is status. Stat Radar. [2013-05-08]. (原始內容存檔於2013-07-27).
- ^ "How can I delete an archived page?". [2015-07-17]. (原始內容存檔於2015-07-21).
- ^ archive.today – webpage capture. archive.today. [2013-05-08]. (原始內容存檔於2012-06-28).
- ^ archive.today FAQ. archive.today. [2013-05-08]. (原始內容存檔於2013-04-20).
- ^ Nelson, Michael L. Archive.is Supports Memento. Research and Teaching Updates. Web Science and Digital Libraries Research Group at Old Dominion University. 2013-07-09 [2013-09-17]. (原始內容存檔於2013-07-27).
- ^ "archive.is" (頁面存檔備份,存於互聯網檔案館) Memento Protocol Information. Memento Development Group. Retrieved 17 September 2013.
- ^ Archiveror – Get this Extension for 🦊 Firefox (en-US). addons.mozilla.org. [2019-06-29]. (原始內容存檔於2019-06-25).
- ^ archive.today Button. chrome.google.com. [2019-06-29]. (原始內容存檔於2019-06-29).
- ^ archive.today. @FukBoyKuupe @atlasnodded I blocked proactively in order not to escalate as in recent Russia vs. http://archive.org case.. 2015-07-21 [2015-07-22]. (原始內容存檔於2015-10-21).
- ^ archive.is is 100% blocked in China. GreatFire Analyzer. 12 August 2018. (原始內容存檔於12 August 2018).
- ^ Jared. Even my school blocks http://archive.today , what the hell. 2015-07-24 [2019-06-29]. (原始內容存檔於2018-12-28).
- ^ archive.is - webpage capture - Google 2014年4月14日 11:21:06 GMT (Peeep.usのキャッシュ (頁面存檔備份,存於互聯網檔案館))
- ^ archive.today - webpage capture - Google 2014年4月18日 17:40:45 GMT (Peeep.usのキャッシュ (頁面存檔備份,存於互聯網檔案館))
- ^ https://archive.today:443/ - 2015年3月22日 22:49 - ウェブ魚拓. megalodon.jp. [2015年7月19日]. (原始內容存檔於2015年6月28日).
- ^ https://archive.is:443/ - 2015年5月14日 01:08 - ウェブ魚拓. megalodon.jp. [2015年7月19日]. (原始內容存檔於2015年6月28日).
- ^ Koebler, Jason. Dear GamerGate: Please Stop Stealing Our Shit. 2014-10-29 [2019-06-29]. (原始內容存檔於2019-06-29).
- ^ Julian Assange - When Google Met WikiLeaks. [2015-07-17]. (原始內容存檔於2015-07-21).
- ^ user, Debian. Julian Assange - Google Is Not What It Seems. 2014-10-24 [2015-07-17]. (原始內容存檔於2016-01-14).
- ^ US Army Official Website Hacked — Syrian Electronic Army. 2015-06-14 [2015-07-17]. (原始內容存檔於2015-06-11).
- ^ Dascalescu, Dan. Web page archiving - Dan Dascalescu's Wiki (review). Wiki.dandascalescu.com. 2013-02-18 [2013-10-03]. (原始內容存檔於2015-10-12).