域名历史查询-互联网档案馆
域名历史查询:http://www.archive.org/index.php
互联网档案馆(The Internet Archive1996年成立,是美国的非赢利性组织,旨在成为全球数字图书馆。档案馆借助Alexa搜索引擎获取网站资料,自1996年开始自动收录并永久性保存网站记录。对于不同的网站,其收录的网页数量和收集周期也不相同,一些大型网站可能每天都会被“备份”一次,每次可能收录数十个以上的网页,而一些小型网站可能每年收录几次,每次只有几个网页。对网站不同时期的历史资料进行研究,是互联网档案馆最大的价值所在。
目前,“互联网档案计划”分为六大部分:
一、电子书
网址:http://www.archive.org/details/texts
这个部分,我以前已经介绍过了,它专门收集公共领域的书籍和文档,任何人都可以免费下载。截至到今天,共有29万多种材料,堪称互联网上最好的公共领域图书搜索引擎。
它主要收集英语书籍,但也包括少部分其他语种的书籍,比如朱熹的《论语集注》。
二、网页
网址:http://www.archive.org/web/web.php
这个部分有个专门的名字,叫做”时光倒流机器“(Wayback Machine),它像收集旧报纸那样收集旧网页。举例来说,Yahoo!的首页就有5000多份档案,最早的可以回溯到1996年10月17日,最近的则是2007年8月30日。
要将全世界的网页都保存下来,这需要多大的存储容量啊?根据2006年的统计,当时Wayback Machine的存储容量有2000T,然后还在以每月20T的速度增加。
三、视频
网址:http://www.archive.org/details/movies
这个部分收集视频材料,你在其中可以找到动画片和电影。
四、音频
网址:http://www.archive.org/details/audio
音频材料主要是有声书籍和音乐。
五、软件
网址:http://www.archive.org/details/software
六、教育材料
网址:http://www.archive.org/details/arsdigita
这部分主要是美国大学课程,有视频和文字材料下载,相当于不去北美就可以上那里的课,比如麻省理工学院的《微分方程》和Naropa大学的《艾伦·金斯堡的诗歌》。
一个网站的发展可以通过历次改版面貌体现出来。由于互联网档案馆可呈现网站在各个阶段的原始面貌,包括文本和链接(图片不可见),是查找重要历史文件、研究网站变迁的宝贵资源和工具。
Wayback Machine它保留了从1996年以来近30亿的网页存档,这个非营利组织要致力成为全球最大的网络档案和数字图书馆,不但让很多经典媒体得以保存(文本、图像、声音、视频,以及一些软件),还用WayBack项目保存了大量公开站点的历史状态,通过搜索你可以看到许多网站几年前的样子,对比一下你就更容易感受到网络技术的发展了!如果你有自己的网站,是不是也想看看以前的样子呢,感觉一定很亲切吧! Wayback Machine网站的地址是http://web.archive.org ,网站历史查询工具的使用方法是在查询框中输入网址并点击查询档案按钮“Take me back”,就可以看到一个网站在不同年月的历史资料。
发布几个月的新网站一般不会被收录,要经过一段时间后才能被记录。如果网站长时间未被Wayback Machine收录,可以通过在Alexa的提交入口中提交网站,以提醒Alexa的搜索引擎爬虫前往抓取网站数据:http://pages.alexa.com/help/webmasters/index.html#crawl_site ,从而尽快获得Wayback Machine的收录。
原创文章如转载,请注明:转载自常州SEO-网站推广优化-iitding
原文地址:http://www.dingseo.com.cn/post/57.html