如何调整检索策略,以达到满意的检索效果

作者&投稿:爰肺 (若有异议请与网页底部的电邮联系)
联系检索实际,以一种检索工具为例,说明如何调整检索策略,以达到满意的检索效果~

类级别检索策略有立即检索和延迟检索,默认的检索策略是立即检索。在Hibernate映射文件中,通过在上配置lazy属性来确定检索策略。对于Session的检索方式,类级别检索策略仅适用于load方法;也就说,对于get、qurey检索,持久化对象都会被立即加载而不管lazy是false还是true.一般来说,我们检索对象就是要访问它,因此立即检索是通常的选择。由于load方法在检索不到对象时会抛出异常(立即检索的情况下),因此我个人并不建议使用load检索;而由于中的lazy属性还影响到多对一及一对一的检索策略,因此使用load方法就更没必要了。

关联级别检索策略有立即检索、延迟检索和迫切左外连接检索。对于关联级别检索,又可分为一对多和多对多、多对一和一对一两种情况讨论。

一对多和多对多关联关系一般使用配置。有lazy和outer-join属性,它们的不同取值绝对了检索策略。

1)立即检索:这是一对多默认的检索策略,此时lazy=false,outer-join=false.尽管这是默认的检索策略,但如果关联的集合是无用的,那么就不要使用这种检索方式。

2)延迟检索:此时lazy=true,outer-join=false(outer-join=true是无意义的),这是优先考虑的检索方式。

3)迫切左外连接检索:此时 lazy=false,outer-join=true,这种检索策略只适用于依靠id检索方式(load、get),而不适用于query的集合检索(它会采用立即检索策略)。相比于立即检索,这种检索策略减少了一条sql语句,但在Hibernate中,只能有一个配置成 outer-join=true.

多对一和一对一检索策略一般使用、配置。中需要配置的属性是 outer-join,同时还需要配置one端关联的的lazy属性(配置的可不是中的lazy哦),它们的组合后的检索策略如下:

1) outer-join=auto:这是默认值,如果lazy=true为延迟检索,如果lazy=false为迫切左外连接检索。

2) outer-join=true,无关于lazy,都为迫切左外连接检索。

3) outer-join=false,如果lazy=true为延迟检索,否则为立即检索。

可以看到,在默认的情况下(outer-join=auto,lazy=false),对关联的one端对象Hibernate采用的迫切左外连接检索。依我看,很多情况下,我们并不需要加载one端关联的对象(很可能我们需要的仅仅是关联对象的id);另外,如果关联对象也采用了迫切左外连接检索,就会出现select语句中有多个外连接表,如果个数多的话会影响检索性能,这也是为什么Hibernate通过hibernate.max_fetch_depth属性来控制外连接的深度。对于迫切左外连接检索,query的集合检索并不适用,它会采用立即检索策略。

对于检索策略,需要根据实际情况进行选择。对于立即检索和延迟检索,它们的优点在于select语句简单(每张表一条语句)、查询速度快,缺点在于关联表时需要多条select语句,增加了访问数据库的频率。因此在选择即检索和延迟检索时,可以考虑使用批量检索策略来减少select语句的数量(配置batch-size属性)。对于切左外连接检索,优点在于select较少,但缺点是select语句的复杂度提高,多表之间的关联会是很耗时的操作。另外,配置文件是死的,但程序是活的,可以根据需要在程序里显示的指定检索策略(可能经常需要在程序中显示指定迫切左外连接检索)。为了清楚检索策略的配置效果如何,可以配置show_sql属性查看程序运行时Hibernate执行的sql语句。

一、 举例说明Google高级搜索操作符filetype:的使用效果。(15分)
(1)Google 的filetype操作符用来限定所要检索文件的格式,后面可加PDF DOC WORD 等,这样搜索结果中就只有符合限定格式的文件,这不但对于我们查找规定格式的文件有重要的意义,而且在查找诸如某些较正式的文件时可以缩小检索范围节省大量的时间。
(2)具体事例,查找PDF格式关于马克思主义历史观的文件,在Google中的检索式,检索结果就是PDF格式的文件

二、 国家统计局发布的数据显示,3月份全国70个大中城市房价同比上涨11.7%,其中新建商品住宅价格同比上涨15.9%。房价的同比涨幅创下了自2005年7月对房价实施月度统计以来的最高水平,也是房价连续第10个月出现同比上涨。国家坚决遏制住房价格过快上涨,出台了一系列楼市调控政策。请查询2010年4月以来,有关调控房价政策,并摘录主要内容,注明信息来源的网站地址。(20)
(1) 信息来源网址http://news.xinhuanet.com/politics/2010-05/18/c_12112455.htm
(2) 摘录主要内容: 4月17日以来,从中央到地方出台了一系列房地产调控政策,频率之高、力度之大、针对性之强前所未见。深受“蜗居”之苦的广大消费者,希望这一轮政府“铁腕治楼”能“大庇天下寒士俱欢颜”。可事实并不如愿。从国家统计局5月12日发布的全国房地产市场运行情况来看,4月份全国70个大中城市房屋销售价格同比依然上涨了12.8%。而且,在国务院政策出台后,4月份后半个月房地产价格环比还是走高。这说明那些认为“政府一出手,楼价立马降”的楼市调控“速胜论”无疑是错误的。
三、 联系检索实际,以一种检索工具为例,说明如何调整检索策略,以达到满意的检索效果。(20)
(1) 缩小检索范围。 以百度为例,查找电子信息工程专业的论文,在检索框中输入:电子信息工程,得到相关网页17800000个,第一个是电子信息工程 百度百科, 这显然不符合要求;检索框中输入内容改为 电子信息工程 论文 第一个检索结果就是我想要的结果。
(2) 扩大检索范围。
四、 什么叫核心期刊?请查询四川建筑职业技术学院教师于2009年一共有多少篇文献被核心期刊所收录?其中《四川建筑科学研究》杂志收录我院的文献有多少篇?(20分)
核心期刊:期刊中学术水平较高的刊物,是我国学术评价体系的一个重要组成部分。它主要体现在对科研工作者学术水平的衡量方面,如在相当一批教学科研单位申请高级职称、取得博士论文答辩资格、申报科研项目、科研机构或高等院校学术水平评估等,都需要在在核心期刊上发表一篇或若干篇论文。
注:不知道你具体什么专业的 所以第五题没做 还是希望对你有所帮助 我做的题质量没问题 你可以自己参照参照

计算机文献检索的基本方法与策略

计算机信息检索,实质上由计算机将输入的检索策略与系统中存贮的文献特征标识及其逻辑组配关系进行类比、匹配的过程。由于信息需求本身具有不确定性,加之对数据库中的文献特征标识不能充分了解,以及系统功能的某些限制,都会不同程度地影响检索效果。但是只要遵循一定的检索步骤,制定良好的检索策略,便可以减少各种不利因素的影响,尽可能地使检索提问标识与信息需求和检索系统保持良好的一致性,从而在系统中检索出满足用户需求的信。

1.检索步骤

(1)弄清信息需求,明确检索目的

信息需求是人们客观上或主观上对各种情报信息的一种需求。这种需求是人们索取情报信息的出发点,也是联机信息检索时选择数据库、确定检索策略以及评价检索效果的依据。不同类型的课题,其信息需求的范围和程度也不尽相同。例如,申请发明、申报成果奖励、鉴定及立项类的查新课题,往往需要全面地收集某一主题范围的文献信息,这类课题具有普查、追溯的特点,应着眼于查全;而对于科研、生产中为解决某一特定问题的攻关课题,往往只要求检出的信息对自己的研究有所帮助,而对查找的文献范围不需要很广。因此,这类课题则要求查准。

如何对信息需求进行正确的分析呢?不妨从信息需求的形式和内容两方面来分析。有关信息的形式需求要明确的问题有:

①明确检索目的。检索是为了申报成果,还是为了了解学科的最新进展等等,据此以制定出符合查全或查准要求的检索策略。

②明确所需的文献量。规定所需文献数量的上限,对以后确定检索策略和控制检索费用是一个很重要的参数;同时还需对检索课题可能有的相关文献量做出估计。

③明确所需文献的语种、年代范围、类型、作者或其他外表特征,这对限定检索范围也很重要。

关于信息的内容需求要明确的主要问题有:

①明确检索课题内容涉及的主要学科范围,这对以后选择合适的数据库很重要。

②分析检索课题的主要内容,用自然语言来表达这些内容要求,这是联机检索中较为重要的环节。

(2)选择数据库,确定检索途径

分析了信息需求后,可根据已知的条件来选择合适的数据库,这一步隐含了检索系统的选择。如欲检索国外专利文献,则可以检索国内的BDSIRS系统的GWZL库。但其提供的检索途径及报道最新专利文献方面不及美国的DIALOG系统的WPI库,当检索要求较高时,仍常选用美国的DIALOG系统。

选择数据库时,首先应了解:

①数据库收录的信息所涉及的学科领域;

②收录的文献类型,最好能进一步了解文献的主要来源;

③收录的时间范围;

④数据库的基本索引及辅助索引,它们提供的检索途径及检索标识的特点;

⑤数据库的检索费用,包括机时费和每篇记录的打印费。

数据库选定之后,其提供的检索途径也随之确定,并可根据已知的条件来确定某一个或几个检索途径。由于计算机存贮容量大和运算速度快,又对比较多的字段建立了索引,它不仅可以从手检中常用的主题词、分类号及作者等途径检索,而且可以从篇名、文摘的自由词、文献类型、期刊名称等途径进行检索,并且还能利用各种途径的组配进行交叉检索,这些都是手工检索所不及的。

(3)确定课题的概念组面和检索标识

弄清信息需求,了解了检索课题的主要内容后,确定其概念组面和检索标识是重要的一步。当检索课题包含较复杂的主题内容时,应明确组成课题内容的几个概念组面,并通过一定的逻辑组配形成一定的复合概念或概念关系来表达用户的信息需求。

确定了课题的概念组面,还须将概念组面转换成相应的为系统所识别的检索标识,检索标识的表示应符合两方面的要求,一是切题性,即检索标识反映信息需求;二是匹配性,即检索标识和检索系统的存贮特征标识相一致。

检索标识一般有如下三种形式:

①规范词: 从待检数据库的叙词表或主题词表中选取规范化的词或词组,因为词表是数据库标引和检索必须共同遵循使用的检索语言。为了使检索提问标识与文献特征标识相一致,获得最佳的检索效果,应优先选用规范词。

②规范化的代码: 索引代码是数据库系统为某些主题范畴或主题概念规定的索引单元。这类单元有很好的专指性,是一种有较好检索效果的文献特征标识。如国际专利分类号IC=,PTS数据库的产品代码PC=,标准工业代码SC=等等。

③自由词:使用自由词检索能够充分利用系统的全文查找功能。规范词或代码的选择需利用词表或分类表等进行自然语言到规范语言的转换,而标引人员和检索人员的思路不一致时也会影响检索效果。此时,用自由词在篇名、文摘甚至全文中查找显露出一定优越性,自由词直接、简明是科技人员易为接受、较为常用的一种方法。

④拟定检索提问式,确定具体的查找程序

检索提问式,是指计算机信息检索中用来表达用户检索提问的逻辑表达式,由检索词和各种布尔逻辑算符、位置算符以及系统规定的其他组配连接符号组成。从某种意义上讲,检索式是检索策略的具体体现,它的质量好坏,将关系到检索策略的成败。

检索标识确定后,接下来就是用一定的组配关系把各个检索标识联接起来组成检索提问式,并表达各种复杂的概念关系,以准确地表达信息需求。要注意各种逻辑运算符、位置算符、截词符等的使用方法,如位置算符的松紧程度及先后次序,还要考虑各个检索项的限定要求及输入的次序,以及根据反馈信息对检索式进行调整等,参见检索策略部分。

2.检索策略

(1)检索策略的概念

所谓检索策略,就是在分析课题内容具有哪些概念单元的基础上,确定检索系统、检索文档、检索途径和检索词,并科学安排各检索词之间的位置关系和逻辑关系以及查找步骤等。检索策略考虑得是否周全,直接影响文献的查全率和查准率。

(2)制定检索策略的步骤

制定检索策略的前提条件是明确数据库及整个检索系统的基本性能。不同数据库收藏内容、标引方法和检索方法是不同的,不同检索系统配备不同的技术性能和操作符。在制定检索策略之前对数据库有几条检索途径,这些途径的标引所遵循的规则都必须有比较清醒的认识。如果在提问式中列出系统没有的检索点,是不可能检出文献的。

(3)制定检索策略的基础是弄清检索课题的内容要求和检索目的。在这一基础上,才能对检索课题进行概念分析,如果课题属单一概念就用单个检索词表达,若课题概念复杂,就把复杂概念分解为若于个概念单元,再用逻辑运算符把表达概念单元的检索词组配起来。将概念单元转换为检索词时,应尽量选用规范化词。检索新课题、边缘学科或是比较含糊的概念时,应特别小心,因为这些词往往没有收入系统,这里应从专业范畴出发选用本学科内具有检索意义的关键词即自由词,不然就会带来误检或漏检。

(4)检索策略构成的关键是正确地选词和配备逻辑符。

(5)调整检索策略。在计算机中检索中,常常会出现文献资料过少甚至为零,或文献资料过多的情况。作为检索人员,应与用户进行分析,及时调整检索策略,以使检索达到令人满意的效果。文献资源过多或过少,均可通过增加检索项,运用布尔逻辑的组配,以增加或缩小检索范围,达到减少或增加命中文献的目的。通常来说,逻辑与总是缩小检索范围,达到查准的目的;逻辑或总是扩大检索范围,达到查全的目的。而逻辑非总是排它检索,缩小检索范围,达到查准的目的。

3.检索效率

检索效率就是利用检索系统(或工具)开展检索服务时产生的有效结果。它直接反映检索系统的性能,影响系统在信息市场上的竞争能力和用户的利益。检索效率包括技术效果和社会经济效果两个方面。技术效果主要指系统的性能和服务质量,系统在满足用户的信息需要时所达到的程度。社会经济效果是指系统怎样经济有效地满足用户需要,使用户或系统本身获得一定的社会效益和经济效益。我们以下讨论的主要是系统技术效果的评价问题。

在检索中最理想的是查全率和查准率都达到100%,就是数据库中收录的全部相关文献都被检索出来,而且检索出来的文献全部都是相关文献。但事实上,检索中有许多因素使这个指标很难达到,总存在一定的误差。那么就出现了两个评价误差的指标漏检率和误检率。

在评价工作中,最常用的是查全率和查准率,而且应同时使用,否则就难以反映检索系统的功能及检索结果的效率。查准率和查全率结合起来,描述了系统的检索成功率、查全率和查准率之间有着互逆的关系,就是说查全率提高,查准率就下降,反之亦然。在计算机检索中,一般认为查准率为60—70%、查全率为40—60%是较为理想的。

系统的收录范围、索引语言、标引和检索等都是影响查全率和查准率的因素,这里就不再一一细讲。

4.提高检索效率的措施

(1)提高文献库的编辑质量,使它的收录范围更全面、更切合相应学科或专业的需要,著录内容更详细准确。

(2)提高标引质量,标引前后要一致,用词要恰当,组配要合理,努力做到:正确揭示主题一不错标;全面反映主题一不漏标;简练地使用标识一不滥标。

(3)提高索引语言的专指性和词表质量。加强对索引词汇的控制,完善词表的结构及其参照关系,使索引语言既有利于族性索引,又有利于特性检索。词表结构要完善,词与词之间关系正确,正确控制同义词和多义词,及时反映新学科新技术的术语等。

(4)提高检索人员的工作水平和能力,了解数据库收集的内容和加深对词表结构的理解,正确做出主题分析,选择合适的检索文档,选择恰当的检索词表达查找主题内容,进行恰当的逻辑组配,找出最佳检索途径,从而制定出最优的检索策略。

(5)调整查全率和查准率。

在实际的检索中可合理地调节查全率和查准率,根据不同的检索要求,使检索的结果最大限度地满足检索的要求。在实际检索中,有时对查全率要求很高,希望不遗漏任何一篇有关的文献,而查准率低一点也行;而有时只需测览一些新的重要文章,不全部要,这里就要求较高的查准率,查全率低一点也行。总之,在检索时要合理地调节查全率和查准率,从而达到最佳的检索效果。


当检索结果太多查准率较低时检索式可做如下哪项调整
当检索结果过多且查准率较低时,可以尝试调整检索式。一种可能的策略是增加筛选条件,如缩小关键词范围、提高关键词的精确度,或者使用更复杂的逻辑运算符(如AND、OR等)来增加检索结果的集中性。此外,还可以考虑使用更高级的检索工具或算法,如深度学习、长文本检索等,以提高查准率并减少检索结果的数量...

文献检索6个步骤
文献检索6个步骤如下:(一)分析检索课题,明确目的和要求。(二)根据课题要求,制定检索策略。(三)选择检索工具或者检索系统。(四)确定检索方法和途径。(五)查找文献,调整检索策略。(六)检索效果评价。资料拓展:研究一个课题,首先你得弄清楚你即将研究的课题是否有研究价值。这需要请图书馆咨询机构为你...

信息检索考试!!构造检索表达式是什么?实施检索策略怎么写?!
一、构造检索表达式就是用布尔逻辑算符、截词检索算符、位置检索算符、限制检索算符、匹配检索算符等符号与检索关键词进行组配,形成表达一定意义的短语或者句子的过程。二、检索策略:(search strategy)又称“查找策略”。处理情报检索提问的逻辑和查找步骤的科学安排。即在分析情报需求实质,明确检索提问的...

查新检索策略怎么写
问题八:如何调整检索策略,以达到满意的检索效果 计算机文献检索的基本方法与策略 计算机信息检索,实质上由计算机将输入的检索策略与系统中存贮的文献特征标识及其逻辑组配关系进行类比、匹配的过程。由于信息需求本身具有不确定性,加之对数据库中的文献特征标识不能充分了解,以及系统功能的某些限制,都会不同程度地影响检索...

面对较为复杂的检索内容时,如何才能获得理想的检索结果?
8、使用专业资源:对于特定领域或主题的搜索,尝试使用专业资源和数据库,如学术期刊、行业报告、专业论坛等,以获取更专业和可靠的信息。9、不断尝试和调整搜索策略:如果您的搜索结果不理想,不要放弃。尝试不同的搜索策略,调整关键词、搜索选项等,以获得更准确和理想的结果。确定检索词时应该注意的...

怎样写文献检索的检索策略?
文献检索的检索策略写法如下:1.查找范围:根据第一步对检索的时间,地域,语种以及文 献类型等的分析,确定一个合理的检索范围.2.选择检索手段:一般来说利用光盘检索系统,结合检索相 应的网络数据库能满足多数检索要求; 没有机检条件时则选用手 工检索。3.选择检索系统: 选择合适的检索系统主要是选择检索...

计算机检索策略怎么制定
(5)选择主题词。注意所选检索词的全面性、专指性和一致性。应注意选用国内外通用的技术用语,不要遗漏同义词、缩写,以及不同拼写的英文单词,更应注意提取项目的隐含概念;(6)根据各检索词之间的相互关系,制定出多个能从不同角度、不同层次反应情况的检索策略,并根据检索结果不断调整检索策略。

文献检索策略是什么?
检索策略输入检索系统后,系统响应的检索结果有时不一定能满足课题检索的要求,例如:或者检出的篇数过多,而且不相关文献所占比例很大,或者检出的文献数量太少,有时甚至为零,这时就需要调整检索策略。 调整检索策略之前,首先要分析造成检索结果不理想的原因。对于输出篇数过多的情况,应分析是否是由下述原因造成的:①选用...

情报检索策略计算机检索
在实施策略调整时,一方面需要通过学科专业知识进行概念分析,选择合适的关键词、专指词和权值,确定概念组和逻辑关系;另一方面则依赖于计算机检索系统的功能,如对文献的类型、时间范围和类型等进行操作,以精确控制检索结果。总的来说,制定和优化检索策略是确保计算机检索有效性和针对性的关键步骤。

检索策略包括哪些步骤
c.交替法:正文法和引文法交替使用。(3)确定检索工具。根据学科专业、语种等,选择一种或多种检索工具或检索 引擎。(4)确定检索途径。主题、分类或作者 (5)实施检索。注意检出一批结果后,应浏览题目和文摘,判断是否满足要求 ,并加以筛选,若感到不满意,应及时修改检索策略,加以调整,再行检索,直到满意...

北辰区13611215382: 联系检索实际,以一种检索工具为例,说明如何调整检索策略,以达到满意的检索效果 -
柯符优尼: 类级别检索策略有立即检索和延迟检索,默认的检索策略是立即检索.在Hibernate映射文件中,通过在<class>上配置lazy属性来确定检索策略.对于Session的检索方式,类级别检索策略仅适用于load方法;也就说,对于get、qurey检索,持久...

北辰区13611215382: 根据你平时的检索实例,说明怎样调整检索方案,得到满意的检索结果.
柯符优尼: 先到大的搜索引擎去,一般都有“网站登陆”.点下进去登记吧!很简单,当然也有批量提交的软件.登录搜索引擎是推广网站很重要的一步也是第一步.下面我们就开始吧,在这里我仅向大家推荐几个我认为还不错的搜索引擎..NO1、百...

北辰区13611215382: 如何调整检索策略,从搜索引擎中得到的结果较为准确 -
柯符优尼: 用一些技巧啊 用“+”连接两个词表示搜索同时含这两个词的信息,也可以用空格连接;用“-”连接两个或多个词,表示从含第一个词中的所有信息中除去含第二个词的信息,比如“山东-济南”表示结果将含有山东但是不含有济南;一般来说用这两种技巧就够了,还有,从搜索引擎中挑选结果时尽量选择考前的条目,它们是访问量较高的可信赖条目,在下载时更要记住这一点…其他的,就要掌握一些搜索引擎的自身特点,比如搜论文什么的可以用“北大天网”,搜影片可以用百度或谷歌,等等…好了,说这么多,希望能帮到你

北辰区13611215382: 检出文献太多、太少时,如何调整检索策略 -
柯符优尼: 一般从题目开始用关键词,如果太少,应用摘要; 如果还少,只能用全文!反之亦然!

北辰区13611215382: 在信息检索实际过程中,如果需要缩小检索范围时,如何调整检索策略 -
柯符优尼:[答案] 用布尔检索and就是缩小范围

北辰区13611215382: 网络信息检索的策略与技巧 -
柯符优尼: 网络信息检索策略设计应遵循快、准、全及低成本的原则,以实现检索策略最优化.1、明确检索目标,确定检索项分析主题、使用布尔逻辑算符等构造检索式2、选择合适的检索系统根据检索主题和检索系统的特点选择检索系统3、正确对待检...

北辰区13611215382: 简述调整检索策略的方法 -
柯符优尼: 学习啊···

本站内容来自于网友发表,不代表本站立场,仅表示其个人看法,不对其真实性、正确性、有效性作任何的担保
相关事宜请发邮件给我们
© 星空见康网