Khiêu chuyển đáo nội dung

Võng trạm thời quang cơ

本页使用了标题或全文手工转换
Duy cơ bách khoa, tự do đích bách khoa toàn thư
( trọng định hướng tựWayback Machine)
Võng trạm thời quang cơ
Wayback Machine
Tiệt đồ
2021 niên 10 nguyệt đích võng trạm thời quang cơ thủ hiệt
Võng trạm loại hình
Tồn đương
Trì hữu giảHỗ liên võng đương án quán
Võng chỉweb.archive.org編輯維基數據鏈接
Chú sáchKhả tuyển
Thôi xuất thời gian2001 niên 10 nguyệt 24 nhật,​22 niên tiền​ (2001-10-24)[1][2]
Hiện trạngHoạt dược
Biên trình ngữ ngônJava,Python

Võng trạm thời quang cơ( anh ngữ:Wayback Machine) thịVạn duy võngĐíchSổ mãĐương ánQuán, do vị vu mỹ quốcGia lợi phúc ni á châuCựu kim sơnĐíchPhi doanh lợi tổ chứcHỗ liên võng đương án quánSang kiến, diệc vi cai tổ chức tối trọng yếu đích phục vụ chi nhất. Tha duẫn hứa dụng hộ “Hồi đáo quá khứ”, tra khán quá khứ đíchVõng trạmĐích dạng tử. Kỳ sang thủy nhânBố lỗ tư đặc · tạp lợiHòaBruce Gilliat(Anh ngữ:Bruce Gilliat)Khai phát liễu võng trạm thời quang cơ, chỉ tại thông quá bảo tồn dĩ thất hiệu võng hiệt đích tồn đương phó bổn, dĩ “Phổ cập sở hữu tri thức” (universal access to all knowledge). Tự 2001 niên thôi xuất dĩ lai, tiệt chí 2024 niên 1 nguyệt 3 nhật, võng trạm thời quang cơ dĩ tồn đương siêu quá 8600 ức cá võng hiệt hòa siêu quá 99 PB đích sổ cư.[4][5]

Lịch sử[Biên tập]

Võng trạm thời quang cơ do hỗ liên võng đương án quán đích sang thủy nhân bố lỗ tư đặc · tạp lợi hòaBruce Gilliat(Anh ngữ:Bruce Gilliat)Vu 2001 niên thôi xuất, dĩ giải quyết võng trạm tại duy hộ hoặc quan bế thời vô pháp tra khán nội dung đích vấn đề[6],Thử ngoại hoàn năng tra khán võng hiệt đích lịch sử tồn đương bản bổn, sang thủy nhân Kahle hòa Gilliat hi vọng dĩ thử năng vi chỉnh cá hỗ liên võng “Phổ cập sở hữu tri thức” ( universal access to all knowledge )[7].

Wayback Machine giá cá danh xưng nguyên vu động họa phiếnThe Rocky and Bullwinkle Show(Anh ngữ:The Rocky and Bullwinkle Show)Trung đích “WABAC cơ khí(Anh ngữ:WABAC machine)”( phát âm viWay-back), giá thị nhất cáThời gian lữ hànhTrang trí[8][9].Tại động họa phiến đíchBì bác địch đích bất khả năng đích lịch sửNhất tập trung, giác sắc sử dụng giá nhất cơ khí lai kiến chứng, tham dữ thậm chí cải biến lịch sử thượng đích trứ danh sự kiện[10].

Võng trạm thời quang cơ vu 1996 niên khai thủy tồn đươngHoãn tồnVõng hiệt, mục tiêu thị tại ngũ niên hậu tương phục vụ công chi vu chúng[11].Tòng 1996 niên đáo 2001 niên, giá ta tín tức bảo tồn tại sổ tự từ đái thượng, Kahle ngẫu nhĩ duẫn hứa nghiên cứu nhân viên hòa khoa học gia sử dụng sổ cư khố[12].2001 niên, hỗ liên võng đương án quán thành lập ngũ chu niên thời,Gia châu đại học bá khắc lợi phân giáoCử hành liễu võng trạm thời quang cơ đích công bố nghi thức[13].Đương võng trạm thời quang cơ thôi xuất thời, tha dĩ kinh tồn đương liễu siêu quá 100 ức cá hiệt diện[14].

Như kim, sổ cư tồn trữ tại hỗ liên võng đương án quán đích đại hìnhLinuxTiết điểm quần tập thượng[7].Hữu thời hội trọng tân phóng vấn tịnh tồn đương võng trạm đích tân bản bổn ( tham kiến hạ văn kỹ thuật tế tiết )[15].Như quả võng trạm duẫn hứa võng lạc thời quang cơ “Ba trùng tác dẫn”Võng trạm tịnh bảo tồn sổ cư, tắc dã khả dĩ thông quá tại sưu tác khuông trung thâu nhập võng trạm đích URL thủ động bộ hoạch võng trạm[11].

Kỹ thuật tế tiết[Biên tập]

Võng lạc thời quang cơ dĩ kinh khai phát liễu nhuyễn kiện dụng vu “Ba trùng tác dẫn” tịnh hạ tái sở hữu khả công khai phóng vấn đíchVạn duy võngHiệt diện,GopherTằng thứ kết cấu,UsenetCông cáo bản hệ thống hòa khả hạ tái nhuyễn kiện[16].Giá ta “Ba trùng” thu tập đích tín tức tịnh bất năng bao quát hỗ liên võng thượng sở hữu khả dụng đích tín tức, nhân vi hứa đa sổ cư thụ phát bố giả hạn chế hoặc tồn trữ tại bất khả phóng vấn đíchSổ cư khốTrung. Vi liễu khắc phục bộ phân hoãn tồn võng trạm đích bất nhất trí tính, 2005 niên, hỗ liên võng đương án quán khai phát liễu Archive-It.org, sử đắc cơ cấu hòa nội dung sang tác giả khả dĩ tự nguyện thu tập hòa bảo tồn sổ tự nội dung, tịnh sang kiến sổ tự đương án quán[17].

Ba trùng tác dẫn lai tự các chủng lai nguyên, kỳ trung nhất ta thị tòng đệ tam phương đạo nhập đích, nhi lánh nhất ta thị do tồn đương nội bộ sinh thành đích[15].Tự 2010 niên dĩ lai, “Worldwide Web Crawls” nhất trực tại vận hành, tịnh bộ hoạch toàn cầu võng trạm[15][18].

Khoái chiếu bộ hoạch đích tần suất nhân võng trạm nhi dị[15].“Worldwide Web Crawls” trung đích võng trạm bao hàm tại “Ba võng liệt biểu” ( crawl list ) trung, mỗi thứ ba võng đô hội tương võng trạm tồn đương nhất thứ[15].Ba võng khả năng nhu yếu sổ nguyệt thậm chí sổ niên tài năng hoàn thành, cụ thể thủ quyết vu kỳ đại tiểu[15].Lệ như, "Wide Crawl Number 13" tòng 2015 niên 1 nguyệt 9 nhật khai thủy, vu 2016 niên 7 nguyệt 11 nhật hoàn thành[19].Đãn thị, nhất thứ khả năng hữu đa cá ba võng chính tại tiến hành, tịnh thả nhất cá trạm điểm khả năng bao hàm tại đa cá ba võng liệt biểu trung, nhân thử, đối trạm điểm tiến hành ba võng đích tần suất hữu ngận đại đích bất đồng.[15]

Tồn trữ dung lượng đích tăng gia[Biên tập]

Tùy trứ đa niên lai kỹ thuật đích phát triển, võng trạm thời quang cơ đích tồn trữ dung lượng bất đoạn tăng gia. 2003 niên, cận kinh quá lưỡng niên đích công khai phóng vấn, võng trạm thời quang cơ tiện dĩ mỗi nguyệt 12 thái tự tiết ( TB ) đích tốc độ tăng trường. Sổ cư tồn trữ tại do hỗ liên võng đương án quán đích công tác nhân viên định chế thiết kế đíchPetaBox(Anh ngữ:PetaBox)Cơ giá hệ thống thượng. Đệ nhất cá 100 thái tự tiết ( TB ) đích cơ giá vu 2004 niên 6 nguyệt toàn diện đầu nhập sử dụng, bất quá ngận khoái tựu phát hiện, giá ta tồn trữ không gian viễn viễn bất cú[20][21].

Hỗ liên võng đương án quán tại 2009 niên kỳ định chế đích tồn trữ thể hệ kết cấu thiên di đáoSun khai phóng thức trữ tồn(Anh ngữ:Sun Open Storage),Tịnh tạiSun hệ thốngĐíchGia lợi phúc ni áViên khu đíchSun mô khối hóa sổ cư trung tâm(Anh ngữ:Sun Modular Datacenter)Trung thác quản liễu nhất cá tân đíchSổ cư trung tâm[22].Tiệt chí 2009 niên(2009-Missing required parameter 1=month!),Võng trạm thời quang cơ bao hàm đại ước 3 phách tự tiết ( PB ) đích sổ cư, tịnh dĩ mỗi nguyệt 100 thái tự tiết ( TB ) đích tốc độ tăng trường[23].

2013 niên 1 nguyệt, cai công tư tuyên bố liễu 2400 ức cá URL đích đột phá tính lí trình bi[24].2013 niên 10 nguyệt, cai công tư tuyên bố liễu “Bảo tồn hiệt diện” (Save a Page) công năng[25],Duẫn hứa nhậm hà hỗ liên võng dụng hộ tồn đương URL đích nội dung. Giá thành vi liễuThác quản ác ý nhị tiến chế văn kiệnĐích phục vụ lạm dụng uy hiếp[26][27].

Tiệt chí 2014 niên 12 nguyệt(2014-12),Võng trạm thời quang cơ tồn hữu 4350 ức cá võng hiệt, tương cận 9 phách tự tiết ( PB ) đích sổ cư, tịnh thả mỗi chu tăng trường ước 20 thái tự tiết ( TB )[14][28][29].

Cư báo đạo, tiệt chí 2016 niên 7 nguyệt(2016-07),Võng trạm thời quang cơ tồn hữu ước 15 phách tự tiết ( PB ) đích sổ cư[30].

Tiệt chí 2018 niên 9 nguyệt(2018-09),Võng trạm thời quang cơ tồn hữu siêu quá 25 phách tự tiết ( PB ) đích sổ cư[31][32].

Thành trường[Biên tập]

2013 niên 10 nguyệt chí 2015 niên 3 nguyệt, cai võng trạm đích toàn cầuAlexaBài danh tòng 163[33]Biến vi 208[34].2019 niên 3 nguyệt, cai bài danh vi 244[35].

Võng trạm thời quang cơ đích thành trường [36] [37]
Niên phân Dĩ tồn đương đích hiệt diện sổ ( đan vị: Ức )
2005
400
2008
850
2012
1,500
2013
3,730
2014
4,000
2015
4,520
2016
4,590
2017
2,790
2018
3,100
2019
3,450
2020
4,050
2021
5,140
2022
6,400

Võng trạm bài trừ phương châm[Biên tập]

Lịch niên lai, võng trạm thời quang cơ nhất trực tôn trọngCơ khí nhân bài trừ tiêu chuẩn( robots.txt ) dĩ quyết định nhất cá võng trạm thị phủ hội thụ ba võng; hoặc giả như quả dĩ kinh ba võng liễu, tha đích tồn đương thị phủ khả dĩ công khai tra khán. Thông quá sử dụng robots.txt, võng trạm sở hữu giả khả dĩ tuyển trạch thối xuất võng trạm thời quang cơ. Như quả trạm điểm trở chỉ liễu võng hiệt tồn đương, tắc vực trung dĩ tiền tồn đương đích nhậm hà hiệt diện dã tương lập tức hiển kỳ vi bất khả dụng. Thử ngoại, hỗ liên võng đương án quán biểu kỳ, “Hữu thời võng trạm sở hữu giả hội trực tiếp liên hệ ngã môn, yếu cầu ngã môn đình chỉ đối võng trạm tiến hành ba võng hoặc tồn đương. Ngã môn hội tuân thủ giá ta thỉnh cầu.”[38][39]

2017 niên 4 nguyệt 17 nhật, hữu báo đạo xưng, nhất ta võng trạm dĩ kinh đảo bế, thành viTạm đình đích vực(Anh ngữ:Domain parking)( Domain parking ). Tha môn thông quá sử dụng robots.txt bả tự kỷ bài trừ tại sưu tác dẫn kình chi ngoại, giá sử đắc thời quang cơ vô ý trung bài trừ liễu giá ta võng trạm[40].

Võng trạm thời quang cơ đích võng trạm bài trừ phương châm ( Website exclusion policy ) bộ phân cơ vu 2002 niênGia lợi phúc ni á đại học bá khắc lợi phân giáoTín tức quản lý hòa hệ thống học viện phát bố đích 《 quản lý san trừ thỉnh cầu hòa duy hộ đương án hoàn chỉnh tính đích kiến nghị 》 ( anh ngữ:Recommendations for Managing Removal Requests and Preserving Archival Integrity), thử kiến nghị phú dư võng trạm sở hữu giả trở chỉ phóng vấn võng trạm tồn đương đích quyền lợi[41].Võng trạm thời quang cơ tuân thủ liễu giá nhất chính sách, dĩ tị miễn ngang quý đích tố tụng[42].

Võng trạm bài trừ phương châm vu 2017 niên khai thủy phóng khoan, đương thời tha đình chỉ tuân tuần robots.txt, tịnh đối mỹ quốc chính phủ hòa quân phương đích võng trạm tiến hành ba võng hòa hiển kỳ võng hiệt. Tiệt chí 2017 niên 4 nguyệt, võng trạm thời quang cơ canh quảng phiếm địa hốt lược liễu robots.txt, nhi bất cận đối vu mỹ quốc chính phủ võng trạm[43][44][45][46].

Dụng đồ[Biên tập]

Tự 2001 niên võng trạm thời quang cơ công khai phát bố dĩ lai, học giả môn nhất trực tại nghiên cứu tha đích tồn trữ hòa thu tập sổ cư đích phương thức, dĩ cập kỳ tồn đương trung thật tế bao hàm đích hiệt diện. Tiệt chí 2013 niên, học giả môn dĩ kinh tại võng trạm thời quang cơ thượng soạn tả liễu đại ước 350 thiên văn chương, kỳ trung đại bộ phân lai tựTín tức kỹ thuật,Đồ thư quán họcHòaXã hội khoa họcLĩnh vực.Xã hội khoa họcHọc giả môn sử dụng võng trạm thời quang cơ phân tích liễu tòng 90 niên đại trung kỳ chí kim võng trạm đích phát triển đối công tư đích thành trường đích ảnh hưởng[14].

Đương võng trạm thời quang cơ tồn đương nhất cá hiệt diện thời, tha thông thường hội bao hàm đại đa sổSiêu liên tiếp,Dĩ sử giá ta liên tiếp tao hỗ liên võng đích bất ổn định tính khinh dịch phá phôi thời, năng cú nhưng nhiên bảo trì hoạt động trạng thái. Ấn độ đích nghiên cứu nhân viên nghiên cứu liễu võng trạm thời quang cơ bảo tồn tại tuyến học thuật xuất bản vật trung đích siêu liên tiếp đích năng lực đích hữu hiệu tính, phát hiện tha bảo tồn liễu lược đa vu nhất bán đích siêu liên tiếp.[47]

Hữu ký giả sử dụng võng trạm thời quang cơ tra khán thất hiệu đích võng trạm, quá thời đích tân văn báo đạo dĩ cập bị canh cải đích võng trạm nội dung. Kỳ nội dung dĩ dụng vu truy cứu chính trị gia đích trách nhậm, yết xuyên tranh luận tràng hợp thượng đích hoang ngôn[48].2014 niên, ô khắc lan đông bộPhân liệtĐịa khu bạn quânĐốn niết tì khắc nhân dân quânLĩnh đạo nhânY qua nhĩ · tư đặc liệt nhĩ khoa phuĐích xã giao môi thể đích tồn đương hiệt diện hiển kỳ, tha xuy hư tự kỷ đích bộ đội kích lạc liễu nhất giá nghi tự ô khắc lan quân dụng phi cơ, hậu lai tài tri đạo giá giá phi cơ thật tế thượng thị nhất giá mã hàng dân hàng khách cơ (Mã lai tây á hàng không 17 hào ban cơ), chi hậu, tha san trừ liễu phát bố đích giá thiên văn chương, tịnh chỉ trách ô khắc lan quân phương kích lạc liễu giá giá phi cơ[48][49].2017 niên, tại xã giao võng trạmRedditĐích thảo luận trung, hữu nhân biểu kỳ phóng vấn quáarchive.orgTịnh phát hiện bạch cung võng trạm san trừ liễu sở hữu đề cập khí hầu biến hóa đích nội dung, đối thử, nhất vị dụng hộ bình luận đạo: “Khoa học gia hữu tất yếu tại hoa thịnh đốn cử hành nhất thứ du hành”, thử sự thành vi liễuVi khoa học du hành( March for Science ) cử hành đích nguyên nhân[50][51][52].

Tồn tại cục hạn[Biên tập]

2014 niên, tòng trảo thủ võng trạm đáo tha khả dĩ tại võng trạm thời quang cơ thượng tra khán chi gian tồn tại 6 cá nguyệt đích diên trì thời gian[53].Mục tiền, cai diên trì thời gian vi 3-10 tiểu thời[54].Võng trạm thời quang cơ cận đề cung hữu hạn đích sưu tác công năng, tha đích “Trạm điểm sưu tác” ( Site Search ) công năng duẫn hứa dụng hộ căn cư miêu thuật trạm điểm đích từ hối lai tra trảo trạm điểm, nhi phi võng hiệt bổn thân đích từ hối[55].

Do vu võng lạc ba trùng đích hạn chế, võng trạm thời quang cơ vô pháp hoàn toàn tồn đươngHỗ động thức võng hiệt,Lệ nhưFlash bình đàiHòa sử dụngJavaScriptHòaTiệm tiến thức võng lạc ứng dụng trình tựBiên tả đích biểu đan, nhân vi giá ta công năng nhu yếu dữ túc chủ võng trạm giao hỗ. Võng trạm thời quang cơ đích võng lạc ba trùng ngận nan đề thủ nhậm hà vị sử dụngHTMLHoặc kỳ biến hình biên mã đích nội dung, giá thông thường hội đạo trí siêu liên tiếp tổn phôi hòa đồ tượng đâu thất. Nhân thử, võng lạc ba trùng vô pháp tồn đương bất bao hàm chỉ hướng kỳ tha hiệt diện đích liên tiếp đích “Cô lập hiệt diện” ( Orphan page )[55][54].Do vu kỳ ba trùng trình tự cận năng căn cư kỳ dự thiết đích thâm độ hạn chế truy tung hữu hạn sổ lượng đích siêu liên tiếp, nhân thử tha vô pháp tồn đương mỗi cá hiệt diện trung đích mỗi cá siêu liên tiếp[18].

Pháp luật chứng cư[Biên tập]

Dân sự tố tụng[Biên tập]

Netbula LLC v. Chordiant Software Inc.[Biên tập]

Tại 2009 niên đích “Netbula, LLC v. Chordiant Software Inc.” Nhất án trung, bị cáo Chordiant đề xuấtĐộng nghị,Yếu cầu Netbula cấm dụng kỳ võng trạm thượng đíchrobots.txtVăn kiện, nhân vi cai văn kiện đạo trí võng trạm thời quang cơ truy tố tính địa triệt tiêu liễu đối Netbula võng trạm tiên tiền bản bổn đích tồn đương đích phóng vấn quyền hạn, Chordiant tương tín giá ta hiệt diện trung tồn tại hữu lợi vu tố tụng đích tài liêu[56].

Netbula phản đối cai động nghị, lý do thị bị cáo yếu cầu canh cải Netbula đích võng trạm, tha môn ứng cai trực tiếp vi giá ta hiệt diện trực tiếp truyện hoán hỗ liên võng đương án quán[57].Nhiên nhi, hỗ liên võng đương án quán đích nhất danh cố viên phát biểu liễu tuyên thệ thanh minh, chi trì Chordiant đích động nghị, biểu kỳ tại “Bất đối kỳ vận doanh tạo thành đại lượng phụ đam, phí dụng hòa càn nhiễu” đích tình huống hạ, vô pháp thông quá nhậm hà kỳ tha phương thức phóng vấn võng hiệt[56].

Mỹ quốc gia lợi phúc ni á bắc khu liên bang địa khu pháp việnThánh hà tắcPhân bộ đích địa phương pháp quan hoắc hoa đức · lao ai đức ( Howard Lloyd ) bác hồi liễu Netbula đích luận điểm, tịnh mệnh lệnh tha môn tạm thời cấm dụng robots.txt trở chỉ trình tự, dĩ sử Chordiant khả dĩ kiểm tác tha môn tưởng yếu đích tồn đương hiệt diện[56].

Ba lan điện thị đài[Biên tập]

Tại 2004 niên 10 nguyệt đích “Telewizja Polska USA, Inc.v. Echostar Satellite” No. 02 C 3293, 65 Fed. R. Evid. Serv. 673 (N.D. Ill. October 15, 2004) nhất án trung, nhất danh tố tụng đương sự nhân thí đồ sử dụng võng trạm thời quang cơ đích đương án tác vi hữu hiệu chứng cư đích lai nguyên, thử cử khả năng chúc vu thủ thứ. Ba lan điện thị đài thịTVP Polonia(Anh ngữ:TVP Polonia)Đích cung ứng thương,EchoStar(Anh ngữ:EchoStar)Vận doanhDish Network.Tại thẩm phán trình tự chi tiền, EchoStar biểu kỳ, tha đả toán đề cung võng trạm thời quang cơ khoái chiếu, tác vi ba lan điện thị đài võng trạm quá khứ nội dung đích chứng cư.

Tham khảo văn hiến[Biên tập]

  1. ^WayBackMachine.org WHOIS, DNS, & Domain Info – DomainTools.WHOIS.[2016-03-13].(Nguyên thủy nội dungTồn đương vu 2020-05-14 ).
  2. ^InternetArchive.org WHOIS, DNS, & Domain Info – DomainTools.WHOIS.[2016-03-13].(Nguyên thủy nội dungTồn đương vu 2020-05-12 ).
  3. ^archive.org Competitive Analysis, Marketing Mix and Traffic - Alexa.alexa.com.[2020-06-06].( nguyên thủy nội dungTồn đươngVu 2020-05-18 ).
  4. ^Internet Archive: Wayback Machine.web.archive.org. (Nguyên thủy nội dungTồn đương vu 2023-03-13 ).The current number of archived pages can be seen at the archive'shome page.
  5. ^Kahle, Brewster.A Message from Internet Archive Founder, Brewster Kahle.Internet Archive.[10 January2024].
  6. ^Notess, Greg R. The Wayback Machine: The Web's Archive. Online. March–April 2002,26:59–61.
  7. ^7.07.120,000 Hard Drives on a Mission | Internet Archive Blogs.blog.archive.org.[2018-10-15].(Nguyên thủy nội dungTồn đương vu 2018-10-20 )( mỹ quốc anh ngữ ).
  8. ^Green, Heather.A Library as Big as the World.BusinessWeek. 2002-02-28. (Nguyên thủy nội dungTồn đương vu 2011-12-20 ).
  9. ^Tong, Judy.Responsible Party – Brewster Kahle; A Library Of the Web, On the Web.New York Times. 2002-09-08[2011-08-15].( nguyên thủy nội dungTồn đươngVu 2011-02-20 ).
  10. ^Can the Internet Be Archived?.The New Yorker. 2015-01-26[2019-01-23].( nguyên thủy nội dungTồn đươngVu 2015-01-25 ).
  11. ^11.011.1Internet Archive: Wayback Machine.archive.org.[2018-10-15].(Nguyên thủy nội dungTồn đương vu 2014-01-03 )( anh ngữ ).
  12. ^Cook, John.Web site takes you way back in Internet history.Seattle Post-Intelligencer. 2001-11-01[2011-08-15].( nguyên thủy nội dungTồn đươngVu 2014-08-12 ).
  13. ^Wayback Goes Way Back on Web.Wired. 2001-10-28[2017-10-16].( nguyên thủy nội dungTồn đươngVu 2017-10-16 ).
  14. ^14.014.114.2Arora, Sanjay K.; Li, Yin; Youtie, Jan; Shapira, Philip. Using the wayback machine to mine websites in the social sciences: A methodological resource. Journal of the Association for Information Science and Technology. 2015-05-05,67(8): 1904–1915.ISSN 2330-1635.doi:10.1002/asi.23503( anh ngữ ).
  15. ^15.015.115.215.315.415.515.6Kalev Leetaru.The Internet Archive Turns 20: A Behind the Scenes Look at Archiving the Web.Forbes. 2016-01-28[2017-10-16].( nguyên thủy nội dungTồn đươngVu 2017-10-16 ).
  16. ^Kahle, Brewster.Archiving the Internet.Scientific American – March 1997 Issue.[2020-04-25].( nguyên thủy nội dungTồn đươngVu 2012-08-03 )( anh ngữ ).
  17. ^Kaplan, Jeff.Archive-It: Crawling the Web Together.Internet Archive Blogs. 2014-11-27[2020-04-24].( nguyên thủy nội dungTồn đươngVu 2017-10-12 )( anh ngữ ).
  18. ^18.018.1Worldwide Web Crawls.Internet Archive.[2020-06-25].( nguyên thủy nội dungTồn đươngVu 2017-10-19 ).
  19. ^Wide Crawl Number 13.Internet Archive.[2020-06-07].( nguyên thủy nội dungTồn đươngVu 2017-10-19 )( anh ngữ ).
  20. ^Internet Archive: Petabox.archive.org. 2020-06-07[2020-06-07].( nguyên thủy nội dungTồn đươngVu 2020-06-03 )( anh ngữ ).
  21. ^Kanellos, Michael.Big storage on the cheap.CNET News.com. 2005-07-29[2020-06-07].(Nguyên thủy nội dungTồn đương vu 2007-04-03 ).
  22. ^Internet Archive and Sun Microsystems Create Living History of the Internet [ hỗ liên võng đương án quán hòa Sun hệ thống sang tạo liễu hỗ liên võng đích tiên hoạt lịch sử ].Sun Microsystems.2009-03-25[2020-06-07].(Nguyên thủy nội dungTồn đương vu 2009-03-26 )( anh ngữ ).
  23. ^Mearian, Lucas.Internet Archive to unveil massive Wayback Machine data center [ hỗ liên võng đương án quán thôi xuất đại quy mô võng trạm thời quang cơ sổ cư trung tâm ].Computerworld.com. 2009-03-19[2020-09-07].(Nguyên thủy nội dungTồn đương vu 2009-03-23 )( anh ngữ ).
  24. ^Kahle, Brewster.Wayback Machine: Now with 240,000,000,000 URLs [ võng trạm thời quang cơ: Hiện hữu 240,000,000,000 cá URL].blog.archive.org. Internet Archive Blogs. 2013-01-09[2020-06-07].( nguyên thủy nội dungTồn đươngVu 2014-04-14 )( anh ngữ ).
  25. ^Rossi, Alexis.Fixing Broken Links on the Internet.archive.org. San Francisco, CA, US: Collections Team, the Internet Archive. 2013-10-25[2020-06-11].( nguyên thủy nội dungTồn đươngVu 2014-11-07 ).We have added the ability to archive a page instantly and get back a permanent URL for that page in the Wayback Machine. This service allows anyone – wikipedia editors, scholars, legal professionals, students, or home cooks like me – to create a stable URL to cite, share or bookmark any information they want to still have access to in the future.
  26. ^The VirusTotal Team.207.241.226.190 IP address information.virustotal.com. Dublin 2, Ireland:VirusTotal.2015-03-25[2020-06-11].(Nguyên thủy nội dungTồn đương vu 2014-07-14 ).2015-03-25: Latest URLs hosted in this IP address detected by at least one URL scanner or malicious URL dataset.... 2/62 2015-03-25 16:14:12 [complete URL redacted]/Renegotiating_TLS.pdf... 1/62 2015-03-25 04:46:34 [complete URL redacted]/CBLightSetup.exe
  27. ^Advisory provided by Google.Safe Browsing Diagnostic page for archive.org.google.com/safebrowsing. Mountain View, CA, US. 2015-03-25[2020-06-11].( nguyên thủy nội dungTồn đươngVu 2015-04-06 ).2015-03-25: Part of this site was listed for suspicious activity 138 time(s) over the past 90 days.... What happened when Google visited this site?... Of the 42410 pages we tested on the site over the past 90 days, 450 page(s) resulted in malicious software being downloaded and installed without user consent. The last time Google visited this site was on 2015-03-25, and the last time suspicious content was found on this site was on 2015-03-25.... Malicious software includes 169 trojan(s), 126 virus, 43 backdoor(s).
  28. ^Internet Archive Frequently Asked Questions.[2020-06-11].( nguyên thủy nội dungTồn đươngVu 2009-02-21 ).
  29. ^Internet Archive Frequently Asked Questions.2014-12-18[2020-06-11].(Nguyên thủy nội dungTồn đương vu 2014 niên 12 nguyệt 18 nhật ).
  30. ^Can the manipulation of big data change the way the world thinks? [ thao túng đại sổ cư năng cải biến thế giới đích tư duy phương thức mạ? ].The National. 2017-01-05[2020-06-07].( nguyên thủy nội dungTồn đươngVu 2017-01-12 )( anh ngữ ).
  31. ^Crockett, Zachary.Inside Wayback Machine, the internet's time capsule.The Hustle. 2018-09-28[2020-06-07].(Nguyên thủy nội dungTồn đương vu 2018-10-02 )( anh ngữ ).
  32. ^Heffernan, Virginia.Things Break and Decay on the Internet—That's a Good Thing.WIRED. 2018-09-18[2018-10-26].( nguyên thủy nội dungTồn đươngVu 2018-09-25 )( anh ngữ ).
  33. ^Archive.org Site Info.Alexa Internet.[2020-06-11].(Nguyên thủy nội dungTồn đương vu 2013 niên 10 nguyệt 28 nhật ).
  34. ^Archive.org Site Overview.Alexa Internet.[2020-06-11].(Nguyên thủy nội dungTồn đương vu 2015-04-09 ).
  35. ^Archive.org Traffic, Demographics and Competitors - Alexa.2019-03-23[2020-06-11].( nguyên thủy nội dungTồn đươngVu 2019-03-23 ).
  36. ^michelle.Wayback Machine Hits 400,000,000,000!.Internet Archive. 2014-05-09[2020-06-11].( nguyên thủy nội dungTồn đươngVu 2014-08-26 ).
  37. ^Internet Archive Wayback Machine.Hỗ liên võng đương án quán.[2020-06-01].(Nguyên thủy nội dungTồn đương vu 2015-02-13 ).
  38. ^Some sites are not available because of Robots.txt or other exclusions. What does that mean?.Võng trạm thời quang cơ.[2020-06-13].(Nguyên thủy nội dungTồn đương vu 2011-04-15 )( anh ngữ ).......All of this information is contained in a file called robots.txt. While robots.txt has been adopted as the universal standard for robot exclusion, compliance with robots.txt is strictly voluntary...... Alexa, the company that crawls the web for the Internet Archive, does respect robots.txt instructions, and even does so retroactively. If a web site owner ever decides he/she prefers not to have a web crawler visiting his / her files and sets up robots.txt on the site, the Alexa crawlers will stop visiting those files and mark all files previously gathered as unavailable......sometimes a web site owner will contact us directly and ask us to stop crawling or archiving a site. We comply with these requests.
  39. ^Cox, Joseph.The Wayback Machine Is Deleting Evidence of Malware Sold to Stalkers.2018-05-22[2020-06-13].(Nguyên thủy nội dungTồn đương vu 2018 niên 5 nguyệt 22 nhật ).
  40. ^Robots.txt meant for search engines don't work well for web archives.Internet Archive. 2017-04-17[2020-06-13].( nguyên thủy nội dungTồn đươngVu 2018-12-04 )( anh ngữ ).
  41. ^Recommendations for Managing Removal Requests And Preserving Archival Integrity.Gia lợi phúc ni á đại học.2002-12-14[2020-06-13].(Nguyên thủy nội dungTồn đương vu 2017-09-18 )( anh ngữ ).
  42. ^Retroactive robots.txt removal of past crawls AKA Oakland Archive Policy.Hỗ liên võng đương án quán. 2014-07-07[2020-06-13].( nguyên thủy nội dungTồn đươngVu 2017 niên 10 nguyệt 10 nhật )( anh ngữ ).
  43. ^Mark Graham.Robots.txt meant for search engines don't work well for web archives [ dụng vu sưu tác dẫn kình đích robots.txt bất thích dụng vu võng lạc tồn đương ].Internet Archive Blogs. 2017-04-17[2020-06-18].( nguyên thủy nội dungTồn đươngVu 2017-04-17 )( anh ngữ ).
  44. ^Archivierung des Internets: Internet Archive ignoriert künftig robots.txt [ hỗ liên võng đương án quán: Hỗ liên võng tồn đương quán tương hốt lược robots.txt văn kiện ].heise online.[2020-06-18].( nguyên thủy nội dungTồn đươngVu 2017-04-27 )( đức ngữ ).
  45. ^Suchmaschinen: Internet Archive will künftig Robots.txt-Einträge ignorieren.Golem.de.[2020-06-18].( nguyên thủy nội dungTồn đươngVu 2017-06-19 )( đức ngữ ).
  46. ^Internet Archive will ignore robots.txt files to keep historical record accurate [ hỗ liên võng đương án quán tương hốt lược robots.txt văn kiện dĩ bảo trì lịch sử văn kiện đích chuẩn xác tính ].Digital Trends. 2017-04-24[2020-06-18].( nguyên thủy nội dungTồn đươngVu 2017-05-16 )( anh ngữ ).
  47. ^Sampath Kumar, B.T.; Prithviraj, K.R. Bringing life to dead: Role of Wayback Machine in retrieving vanished URLs. Journal of Information Science. 2014-11-21,41(1): 71–81.ISSN 0165-5515.doi:10.1177/0165551514552752( anh ngữ ).
  48. ^48.048.1Nelson, Steven.Wayback Machine Won't Censor Archive for Taste, Director Says After Olympics Article Scrubbed.US News.2016-08-17[2020-06-20].( nguyên thủy nội dungTồn đươngVu 2017-01-06 ).The Wayback Machine's unique search function frequently is used as a tool for journalists to review now-dead websites or to comb through dated news reports. The archived content has been used to embarrass politicians and expose battlefield lies.
  49. ^Lepore, Jill.What the Web Said Yesterday.The New Yorker.2015-01-19[2020-06-20].( nguyên thủy nội dungTồn đươngVu 2015-01-25 ).
  50. ^The March for Science began with this person's 'throwaway line' on Reddit [ vi khoa học du hành thủy vu thử nhân tại Reddit thượng “Nhất đái nhi quá đích thoại” ].Washington Post.[2017-04-23].( nguyên thủy nội dungTồn đươngVu 2017-04-23 )( anh ngữ ).
  51. ^Are scientists going to march on Washington? [ khoa học gia yếu khứ hoa thịnh đốn du hành mạ? ].The Washington Post. 2017-01-24[2020-06-20].(Nguyên thủy nội dungTồn đương vu 2017-01-31 )( anh ngữ ).
  52. ^Foley, Katherine Ellen.The global March for Science started with a single Reddit thread.Quartz.[2020-06-20].( nguyên thủy nội dungTồn đươngVu 2017-04-24 )( anh ngữ ).
  53. ^Internet Archive Frequently Asked Questions.Hỗ liên võng đương án quán. 2014-04-02[2020-06-25].(Nguyên thủy nội dungTồn đương vu 2014-04-02 ).
  54. ^54.054.1Using The Wayback Machine.help.archive.org. Hỗ liên võng đương án quán.[2020-06-25].( nguyên thủy nội dungTồn đươngVu 2020-07-06 ).
  55. ^55.055.1Bates, Mary Ellen. The Wayback Machine. Online. 2002,26:80 – thông quá EBSCOhost.
  56. ^56.056.156.2Lloyd, Howard.Order to Disable Robots.txt(PDF).American-Justice.org. 2009-10-15[2020-06-26].(Nguyên thủy nội dung(PDF)Tồn đương vu 2019-08-08 ).
  57. ^Cortes, Antonio L.Motion Opposing Removal of Robots.txt.American-Justice.org. 2009-09-29[2020-06-26].(Nguyên thủy nội dungTồn đương vu 2011-05-13 ).

Tham duyệt[Biên tập]

Ngoại bộ liên tiếp[Biên tập]

Kính tượng võng trạm[Biên tập]

Thật dụng trình tự[Biên tập]