全文搜索引擎与目标索引类搜索引擎有什么区别?

作者&投稿:淡金 (若有异议请与网页底部的电邮联系)
目录类搜索引擎和全文搜索引擎有什么区别?~

全文搜索引擎因为依靠软件进行,所以数据库的容量非常庞大,但是,它的查询结果往往不够准确。分类目录依靠人工收集和整理网站,能够提供更为准确的查询结果,但收集的内容却非常有限。
1.搜索引擎属于自动网站检索,而目录索引则完全依赖手工操作。
2.搜索引擎收录网站时,只要网站本身没有违反有关的规则,一般都能登录成功;而目录索引对网站的要求则高得多,有时即使登录多次也不一定成功。
3.当用于在登录搜索引擎时,我们一般不用考虑网站的分类问题,而登录目录索引时则,必须将网站放在一个最合适的目录(Directory)4.搜索引擎中各网站的有关信息都是从用户网页中自动提取的,所以用户的角度看,我们拥有更多的自主权;而目录索引则要求必须手工另外填写网站信息,而且还有各种各样的限制。
4. 因此,分类目录型搜索引擎营销方法与技术性搜索引擎的方式有很大的不同,需要充分了解,这种区别,才能充分发挥各种不同搜索引擎的作用。

全文搜索是指计算机索引程序通过扫描文章中的每一个词,对每一个词建立一个索引,指明该词在文章中出现的次数和位置,当用户查询时,检索程序就根据事先建立的索引进行查找,并将查找的结果反馈给用户的检索方式。这个过程类似于通过字典中的检索字表查字的过程。目录索引是类似于垂直搜索引擎,事先按照关键词分门别类地存放在相应的目录中,因此用户在查询信息时,可选择关键词搜索,也可按分类目录逐层查找。

一、指代不同

1、全文搜索引擎:通过从互联网上提取的各个网站的信息(以网页文字为主)而建立的数据库中,检索与用户查询条件匹配的相关记录,然后按一定的排列顺序将结果返回给用户。

2、目标索引类搜索引擎:是以网页形式提供查找网络资源的一种网络信息检索工具。

二、特点不同

1、全文搜索引擎:以各类数据如文本、声音、图像等为对象,提供按数据的内容而不是外在特征来进行的信息检索,其特点是能对海量的数据进行有效管理和快速检索。

2、目标索引类搜索引擎:使用自动索引软件来搜集和标记网页资源,并将这些资源存入数据库。当用户输入检索的关键词后,它在数据库中找出与该词匹配的记录,并按相关程序排序后显示输出。


三、影响不同

1、全文搜索引擎:是搜索引擎的核心技术,同时也是电子商务网站的支撑技术。全文检索技术可应用于企业信息网站、媒体网站、政府站点、商业网站、数字图书馆和搜索引擎中。

2、目标索引类搜索引擎:由自动索引软件生成数据库,所收录的网络资源范围广、速度快、更新及时,但因缺乏人工干预,准确性较差。这类检索工具适用于查找特定的信息以及专指性强或不易明确分类的具体问题,例如百度搜索引擎。

参考资料来源:百度百科-索引型搜索引擎

参考资料来源:百度百科-全文搜索引擎



一、指代不同

1、全文搜索引擎:从互联网上提取每个网站的信息(主要是网页文本),检索符合用户查询条件的相关记录,然后按一定顺序将结果返回给用户所建立的数据库。

2、目标索引搜索引擎:是一种以网页形式查找网络资源的网络信息检索工具。

二、特点不同

1、全文搜索引擎:以文本、语音、图像等各种数据为对象,提供基于数据内容而非外部特征的信息检索,具有对海量数据进行有效管理和快速检索的特点。

2、目标索引搜索引擎:使用自动索引软件收集和标记Web资源,并将这些资源存储在数据库中,当用户输入关键字时,在数据库中找到与关键字匹配的记录,并根据相关程序排序后显示输出。

三、影响不同

1、全文搜索引擎:是搜索引擎的核心技术,也是电子商务网站的支撑技术,全文检索技术可应用于企业信息网站、媒体网站、政府网站、商业网站、数字图书馆和搜索引擎。

2、目标索引搜索引擎:数据库是由自动索引软件生成的,其中包含的网络资源范围广,更新速度快,及时,但由于缺乏人工干预,准确性差,这种搜索工具适合于查找特定信息和特定问题,具有很强的特异性或难以明确分类,如百度搜索引擎。

参考资料来源:

百度百科-索引型搜索引擎

百度百科-全文搜索引擎



首先搜索引擎按其工作方式主要可分为三种,分别是全文搜索引擎(Full Text Search Engine)、目录索引类搜索引擎(Search Index/Directory)和元搜索引擎(Meta Search Engine)。

全文搜索引擎与目标索引类搜索引擎区别在于:

全文搜索引擎是目前广泛应用的主流搜索引擎。它的工作原理是计算机索引程序通过扫描文章中的每一个词,对每一个词建立一个索引,指明该词在文章中出现的次数和位置,当用户查询时,检索程序就根据事先建立的索引进行查找,并将查找的结果反馈给用户的检索方式。这个过程类似于通过字典中的检索字表查字的过程。
国外具代表性的有Google、Fast/AllTheWeb、AltaVista、Inktomi、Teoma、WiseNut等,国内著名的有百度(Baidu)。它们都是通过从互联网上提取的各个网站的信息(以网页文字为主)而建立的数据库中,检索与用户查询条件匹配的相关记录,然后按一定的排列顺序将结果返回给用户,因此他们是真正的搜索引擎。
从搜索结果来源的角度,全文搜索引擎又可细分为两种,一种是拥有自己的检索程序(Indexer),俗称“蜘蛛”(Spider)程序或“机器人”(Robot)程序,并自建网页数据库,搜索结果直接从自身的数据库中调用,如上面提到的7家引擎;另一种则是租用其他引擎的数据库,并按自定的格式排列搜索结果,如Lycos引擎。

目录索引
目录索引虽然有搜索功能,但在严格意义上算不上是真正的搜索引擎,仅仅是按目录分类的网站链接列表而已。用户完全可以不用进行关键词(Keywords)查询,仅靠分类目录也可找到需要的信息。目录索引中最具代表性的莫过于大名鼎鼎的Yahoo雅虎。其他著名的还有Open Directory Project(DMOZ)、LookSmart、About等。国内的搜狐、新浪、网易搜索也都属于这一类。

这个资料解释的比较详细:
搜 索 引 擎 分 类
搜索引擎按其工作方式主要可分为三种,分别是全文搜索引擎(Full Text Search Engine)、目录索引类搜索引擎(Search Index/Directory)和元搜索引擎(Meta Search Engine)。

■ 全文搜索引擎
全文搜索引擎是名副其实的搜索引擎,国外具代表性的有Google、Fast/AllTheWeb、AltaVista、Inktomi、Teoma、WiseNut等,国内著名的有百度(Baidu)。它们都是通过从互联网上提取的各个网站的信息(以网页文字为主)而建立的数据库中,检索与用户查询条件匹配的相关记录,然后按一定的排列顺序将结果返回给用户,因此他们是真正的搜索引擎。

从搜索结果来源的角度,全文搜索引擎又可细分为两种,一种是拥有自己的检索程序(Indexer),俗称“蜘蛛”(Spider)程序或“机器人”(Robot)程序,并自建网页数据库,搜索结果直接从自身的数据库中调用,如上面提到的7家引擎;另一种则是租用其他引擎的数据库,并按自定的格式排列搜索结果,如Lycos引擎。

■ 目录索引
目录索引虽然有搜索功能,但在严格意义上算不上是真正的搜索引擎,仅仅是按目录分类的网站链接列表而已。用户完全可以不用进行关键词(Keywords)查询,仅靠分类目录也可找到需要的信息。目录索引中最具代表性的莫过于大名鼎鼎的Yahoo雅虎。其他著名的还有Open Directory Project(DMOZ)、LookSmart、About等。国内的搜狐、新浪、网易搜索也都属于这一类。

■ 元搜索引擎 (META Search Engine)
元搜索引擎在接受用户查询请求时,同时在其他多个引擎上进行搜索,并将结果返回给用户。著名的元搜索引擎有InfoSpace、Dogpile、Vivisimo等(元搜索引擎列表),中文元搜索引擎中具代表性的有搜星搜索引擎。在搜索结果排列方面,有的直接按来源引擎排列搜索结果,如Dogpile,有的则按自定的规则将结果重新排列组合,如Vivisimo。

除上述三大类引擎外,还有以下几种非主流形式:

1、集合式搜索引擎:如HotBot在2002年底推出的引擎。该引擎类似META搜索引擎,但区别在于不是同时调用多个引擎进行搜索,而是由用户从提供的4个引擎当中选择,因此叫它“集合式”搜索引擎更确切些。
2、门户搜索引擎:如AOL Search、MSN Search等虽然提供搜索服务,但自身即没有分类目录也没有网页数据库,其搜索结果完全来自其他引擎。
3、免费链接列表(Free For All Links,简称FFA):这类网站一般只简单地滚动排列链接条目,少部分有简单的分类目录,不过规模比起Yahoo等目录索引来要小得多。

由于上述网站都为用户提供搜索查询服务,为方便起见,我们通常将其统称为搜索引擎。

就是以数据诸如文字,声音,图像等为主要内容,以检索文献资料的内容而不是外表特征的一种检索技术·
主要该系统有TRS系统·天宇系统·等
与其他搜索引擎相比,全文搜索引擎的显著特点是它能够以文中任何一个有检索意义的词作为检索入口,而且取得的检索结果是原始文献,而不是文献线索
随着计算机产业的发展,以计算机存储设备为载体的电子信息愈来愈多,这些信息大致可分为两类:结构化数据和非结构化数据,结构化数据指的是诸如企业财务帐目和生产数据、学生的分数数据等等,非结构化数据的则是一些文本数据、图象声音等多媒体数据等等。据统计,非结构化数据占有整个信息量的80%以上。对于结构化数据,用RDBMS(关系数据库管理系统)技术来管理是目前最好的一种方式。但是由于RDBMS自身底层结构的缘故使得它管理大量非结构化数据显得有些先天不足,特别是查询这些海量非结构化数据的速度较慢。而通过全文检索技术就能高效地管理这些非结构化数据。
经过几年的发展,全文检索从最初的字符串匹配程序已经演进到能对超大文本、语音、图像、活动影像等非结构化数据进行综合管理的大型软件。由于内涵和外延的深刻变化,全文检索系统已成为新一代管理信息系统的代名词,衡量全文检索系统的基本指标也逐渐形成规范。
首先,我们关注的是查全率,即系统在进行某一检索时,检索出的相关资料量与系统资料库中相关资料总量的比率。查准率则是保证我们找到最有用资料的一个关键,是系统在进行某一检索时,检索出的有用资料数量与检索出资料总量的比率。检索速度或者说响应时间是提高工作效率的保障,指的是从提交检索课题到查出资料结果所需的时间。最基本的检索速度是应该达“千万汉字,秒级响应"。还有诸如收录范围(所查找的范围)、用户负担(用户在检索过程中付出精力的总和)、输出形式 (输出信息表现形式)等指标也是衡量全文检索系统优劣的要素。
搜索引擎应该是全文检索技术最主要的一个应用。目前,搜索引擎的使用已成为排在收发电子邮件之后的第二大互联网应用技术。搜索引擎起源于传统的信息全文检索理论,即计算机程序通过扫描每一篇文章中的每一个词,建立以词为单位的到排文件,检索程序根据检索词在每一篇文章中出现的频率和每一个检索词在一篇文章中出现的概率,对包含这些检索词的文章进行排序,最后输出排序的结果。全文检索技术是搜索引擎的核心支撑技术。
一个好的检索引擎是一个理想站点的关键。很多人在访问一个站点时喜欢使用站点检索,站点检索应是分类目录导航和全文检索的完美结合,具体包括以下几个方面:
分类目录导航的关键是检索范围,检索范围的限制能使得检索结果不会太多、太滥;
全文检索对于站点检索是必不可少的,在通常情况下能够帮助人们很快地找到所要的网页;
有时利用分类目录导航和全文检索还很难定位到所要的信息,这时就要组合检索辅助;
必须有相关排序功能,因为当检索结果太多时,用户不可能一一浏览,大多数用户只浏览前面几条,没有相关排序,可能准确的检索结果排在后面,用户不能浏览到,而排在前面的检索结果却相关性很少,造成用户的错觉。
此外,我们还要考虑HTML/XML的特殊性、支持大量并发用户突发访问、Web站点的动态特性、要求索引维护效率很高等方面。
目前的技术实现有Lucene,Solr,ElasticSearch等。全文检索过程分为索引、搜索两个过程:

索引(Indexing)
从关系数据库中、互联网上、文件系统采集源数据(要搜索的目标信息),源数据的来源是非常广泛的。
将源数据采集到一个统一的地方,例如存储系统,要创建索引,将索引创建到一个索引库(文件系统)中,从源数据库中提取关键信息,从关键信息中抽取一个一个词,词和源数据是有关联的。也即创建索引时,词和源数据有关联,索引库中记录了这个关联,如果找到了词就说明找到了源数据(http的网页、电子书、新闻等……)。
搜索(Search)
用户执行搜索(全文检索)编写查询关键字。
从索引库中搜索索引,根据查询关键字搜索索引库中的一个一个词。
展示搜索的结果。


搜索引擎如何搜索到信息?
2.机器人搜索引擎:由一个称为蜘蛛(Spider)的机器人程序以某种策略自动地在互联网中搜集和发现信息,由索引器为搜集到的信息建立索引,由检索器根据用户的查询输入检索索引库,并将查询结果返回给用户。服务方式是面向网页的全文检索服务。该类搜索引擎的优点是信息量大、更新及时、毋需人工干预,缺点是返回信息过多,...

什么是全文检索?
与其他搜索引擎相比,全文搜索引擎的显著特点是它能够以文中任何一个有检索意义的词作为检索入口,而且取得的检索结果是原始文献,而不是文献线索・ 中文名全文检索技术 原理 计算机存储设备为载体 分类 结构化数据和非结构化数据 包括 TRS系统・天宇系统问题四:全文检索和搜索引擎有区别吗? 网钱中国建议从联系中看区...

检索工具有哪些功能
问题九:常用的搜索引擎都有哪些基本类型? 索引擎(search engines)是对互联网上的信息资源进行搜集整理,然后供你查询的系统,它包括信息搜集、信息整理和用户查询三部分。 搜索引擎是一个为你提供信息“检索”服务的网站,它使用某些程序把因特网上的所有信息归类以帮助人们在茫茫网海中搜寻到所需要的信息。 早期的...

搜索引擎的原理是什么?
搜索引擎的原理可以分为:数据收集、建立索引数据库、索引数据库中搜索和排序。1、数据收集:搜索引擎的自动信息收集功能分为两种类型,一种是定期搜索,即每隔一段时间,搜索引擎就会主动发送一个“蜘蛛”程序来搜索特定IP地址范围内的互联网站点,一旦发现一个新网站,它将自动提取该网站的信息和网址,并...

搜索的基本步骤包括
与传统的SQL查询不同,在搜索引擎收集完数据的预处理阶段,搜索引擎往往需要一种高效的数据结构来对外提供检索服务。而现行最有效的数据结构就是“倒排文件”。倒排文件简单一点可以定义为用文档的关键词作为索引,文档作为索引目标的一种结构(类似于普通书籍中,索引是关键词,书的页面是索引目标)。在搜索...

第三代搜索引擎是啥样的
第三代搜索引擎一词在2004年的曝光率(或者叫做“媒体可见性”)非常高,重要原因之一是国内服务商竞相推出“第三代搜索引擎”。 2004年8月3日,国内知名门户网站搜狐正式推出全新独立域名专业搜索网站“搜狗”(www.sogou.com),并声称该搜索引擎是全球首家第三代中文互动式搜索引擎服务提供商。 根据搜狐网站上的说明,“...

百度搜索引擎与 Google搜索引擎的搜索方法比较
这样以来,垂直主题的搜索引擎以其高度的目标化和专业化在各类搜索引擎中占据了一席之地。目前,一些主要...谷歌对外部链接很重视,对页面元索则没有那么敏感,而查看排在前几十位的页面的外部链接,就能看出比较

搜索引擎的发展
1999年5月,发布了自己的搜索引擎AllTheWeb。Fast创立的目标是做世界上最大和最快的搜索引擎,几年来庶几近之。Fast(Alltheweb)的网页搜索可利用ODP自动分类,支持Flash和pdf搜索,支持多语言搜索,还提供新闻搜索、图像搜索、视频、MP3、和FTP搜索,拥有极其强大的高级搜索功能。(2003年2月25日,Fast的互联网搜索部门被...

3.全文检索是一种从全文中检索所需信息的检索技术,其检索的对象为_百度...
就是以数据诸如文字,声音,图像等为主要内容,以检索文献资料的内容而不是外表特征的一种检索技术·主要该系统有TRS系统·天宇系统·等 与其他搜索引擎相比,全文搜索引擎的显著特点是它能够以文中任何一个有检索意义的词作为检索入口,而且取得的检索结果是原始文献,而不是文献线索 随着计算机产业的发展...

搜索引擎优化(seo)常用的高级搜索指令有哪些?
"site"把搜索范围限定在特定站点中,查询自身网站的收录情况。比如:在搜索框输入"site: xx.com",可以快速了解收录情况 "site:"后面跟的站点域名,不要带http:\/\/。"site:"和站点名之间,不要带空格。3、intext "intext"是正文索引,和标题搜索相比,正文索引的搜索目标更明确,而且适合于一次性...

雁峰区18333331585: 目录型搜索引擎有哪些 -
向可止咳: 搜索引擎按照工作方式可以分为三类:1、目录搜索引擎:目录搜索引擎主要有yahoo!、LookSmart、About、DMOZ、Galaxy等.2、全文搜索引擎:全文搜索引擎主要有Google、百度、AltaVista、Inktomi、Alltheweb等.3、元搜索引擎:元搜索引擎主要有InfoSpace、Dogpile、Vivisimo、北大天网、搜狐、Lycos、Meta crawler等.

雁峰区18333331585: 搜索引擎分为哪几类? -
向可止咳: 搜 索 引 擎 分 类搜索引擎按其工作方式主要可分为三种,分别是全文搜索引擎(Full Text Search Engine)、目录索引类搜索引擎(Search Index/Directory)和元搜索引擎(Meta Search Engine).■ 全文搜索引擎全文搜索引擎是名副其实的...

雁峰区18333331585: 1. 搜索引擎按照索引方式、检索特性和检索内容分别划分有哪些类型? -
向可止咳: 索引方式——分为全文搜索引擎(Full Text Search Engine)、目录索引类搜索引擎(Search Index/Directory)和元搜索引擎(Meta Search Engine).检索特性——分为多元搜索引擎(Meta Search Engine)、集成搜索引擎(All-in-One ...

雁峰区18333331585: 电脑信息技术:如果您是电脑方面的专家 -
向可止咳: 1.搜索引擎按其工作方式主要可分为三种,分别是全文搜索引擎(Full Text Search Engine)、目录索引类搜索引擎(Search Index/Directory)和元搜索引擎(Meta Search Engine).2. 搜索引擎的起源 1990年,加拿大麦吉尔大学(University ...

雁峰区18333331585: 搜索引擎有哪些类型,其主要组成是什么? -
向可止咳: 搜索引擎有两种基本类型:一类是纯技术型的全文检索搜索引擎,如google、AltaVista、Inktomi等,其原理是通过机器手(即Spider程序)到各个网站收集、存储信息,并建立索引数据库供用户查询.需要说明的是,这些信息并不是搜索引擎即...

雁峰区18333331585: 搜索引擎一般分为目录索引搜索引擎和全文搜索引擎,下列网站不属于目录索引类搜索引擎A搜狐B百度c网易d 新浪 -
向可止咳:[答案] B

雁峰区18333331585: 搜索引擎是什么?搜索引擎有哪些分类? -
向可止咳: 搜索引擎是一种帮助用户在Internet上查找信息的搜索工具.它以一定的方式对Internet中的信息进行分类存储,并为用户提供检索服务,从而起到信息导航的目的. 搜索引擎实质上就是一个专门为用户提供信息检索服务的网站,可以帮助用户...

本站内容来自于网友发表,不代表本站立场,仅表示其个人看法,不对其真实性、正确性、有效性作任何的担保
相关事宜请发邮件给我们
© 星空见康网