返回列表 下一主题 ›› ‹‹ 上一主题 回复 发帖

[知识] 搜索引擎知识之——(搜索引擎)

[知识] 搜索引擎知识之——(搜索引擎)

  什么是搜索引擎

  神州一剑2008/文/陈剑电子商务知识系列之一

  所谓搜索引擎,就是Internet网上用来查找文件、档案的一个智能化的机器人。我们现在所说的搜索引擎都是基于WWW的,也就是基于网页的检索。现在,根据这种智能化机器人的工作方式,很多人又把它称作爬行蜘蛛,或机械手。

  但是,这些其实并不是互联网上最早的信息检索服务器。在整个Internet有一些称为文件、档案服务器的计算机,这种服务器是Internet上,用来查找其标题,满足特定条件的所有文档的自动搜索服务的工具。

  为了从匿名FTP服务器上下载一个文件,必须知道这个文件的所在地,即必须知道这个匿名FTP服务器的地址,及文件所在的目录名。所以,这种信息检索服务器,就是帮助用户在遍及全世界的无数个FTP服务器中,寻找文件的工具。它另外还被称作文档查询服务器。用户只要给出所要查找文件的全名或部分名字,文档查询服务器就会帮用户查出,在哪些FTP服务器上存放着这样的文件。

  使用信息检索服务器,进行查询要查找的文件名或部分文件名,必须知道某个或几个信息检索服务器的地址。才能帮助你找到你需要的文件,或目录的匿名FTP主机的名字。也就是说,当你想要检索一个你需要了解的文件或目录时,你要做的事情是告诉信息检索服务器。你要检索什么,信息检索服务器将按照你提供的要求进行检索,然后显示每一个包含有那份文件或目录的匿名FTP主机的名字。信息检索服务器还将详细地告诉你目录路径。这样,你就可以轻易地从相应的FTP主机中,取得你所需要的FTP文件。

  信息检索服务器经历了长达20年左右的发展,逐步改进,完善。名称也逐步被统称为爬行蜘蛛,机械手,搜索引擎。

  而从搜索引擎的工作原理上来区分,搜索引擎有三种基本类型;

  第一类是纯技术型的全文检索搜索引擎,如google yahoo等,其原理是通过机器手(即Spider程序)到各个网站收集,存储信息,并建立索引数据库供用户查询。

  第二类称为分类目录搜索引擎,这种搜索引擎并不采集网站的任何信息,而是利用各网站向搜索引擎提交网站信息时,填写的关键词和网站描述等资料,经过人工审核编辑后,如果符合网站登录的条件,则输入数据库以供查询。

  第三类称为元搜索引擎 ,元搜索引擎(MetaSearch)的特点是在接受用户查询请求时,同时在其他多个引擎上进行搜索,把多个独立搜索引擎的搜索结果整合、控制、优化,再把搜索结果输出到客户端。元搜索引擎不需要庞大的网页数据库,而能够搜索到更加丰富、准确的内容。利用其它独立搜索引擎整合、控制、优化搜索结果的技术称为“元搜索技术(Meta-Searching Technique)”,是元搜索引擎的核心技术。在搜索结果排列方面,有的直接按来源引擎排列搜索结果,有的则按自定的规则将结果重新排列组合。

  互联网发展的历史虽然不长,但由于这个领域发展速度非常快,新的公司不断涌现,其中有些很快成为全球知名网站,同时也有大量的公司有如流星一般,只划过一道美丽的光线之后就难觅踪影,但它们对搜索引擎的发展还是做出了不可磨灭的贡献,让互联网的天空永远记住它们,直至一万年。
返回列表 下一主题 ›› ‹‹ 上一主题