如何进行计算机信息检索

作者&投稿:帅骆 (若有异议请与网页底部的电邮联系)
1.试述计算机信息检索的步骤,并举例说明。~

(1)确定检索方向。这是使检索获得满意

结果的先决条件,为此必须弄清所需信息的
诸特征,如学科归属、主题概念、时间界限
、文献类型、国别和语种等。
(2)确定检索方法。一般有三种方法:

a.正文法——从主题、分类、作者等途径
查找。
b.引文法:又叫追溯法,即着眼于文献所
附的参考或引用文献目录。(SCI)


c.交替法:正文法和引文法交替使用。
(3)确定检索工具。根据学科专业、语

种等,选择一种或多种检索工具或检索
引擎。
 (4)确定检索途径。主题、分类或作者
 (5)实施检索。注意检出一批结果后,
应浏览题目和文摘,判断是否满足要求
,并加以筛选,若感到不满意,应及时
修改检索策略,加以调整,再行检索,
直到满意为止。
(6)索取原始文献。检出结果通常是文献线

索,还不是原始文献。为了索取原始文献,还
须进行两项工作:
a.辩识文献款目,包括文献类型、来源、

出版物名称等;
b.查找原始文献的收藏单位,先从本单位

、本地区入手,利用馆藏目录和联合目录(联
网目录),找到原始文献收藏单位,即可通过
借阅、复制或网上传送、馆际互借等途径获得
文献。

计算机信息检索的方式,又称为布尔逻辑检索式:即逻辑“与”用AND(或﹡)表示;逻辑“或”用OR(或+)表示;逻辑“非”用NOT(或-)表示。

1 计算机信息检索的基本方法
4.3.1明确检索要求和检索目标
计算机检索的第一步准备工作是明确检索要求和检索目标。
明确检索要求就是要搞清楚本课题属于什么学科,所需文献的类型及语种,查找文献的年代,所需文献的最佳篇数,允许支配的检索费用。这些要求对选择数据库、构造检索策略都是十分重要的。
确定检索目标也是进行计算机信息检索前应搞清楚的准备工作。例如:如果属于开题调研,则应尽可能地检索出与之相关的全部文献,即要求较高的查全率;以便充分地做好开题的准备工作;如果属于探索性、开创性的课题,则只需要查出一些启发性的文献,对查准率和查全率要求都不一定有很高的要求。
4.3.2课题分析
1. 课题概念的分析方法分析课题就是分析出课题所涉及的主要概念,并找出能代表这些概念的若干个词或词组,进而分析概念之间的上、下、左、右关系。对于新学科、交叉学科和边缘学科的课题,则要搞清楚这些概念之间的关系。概念分析的结果应以概念组为单元的词或词组的形式列出,以便下一步制订检索策略时使用。
2. 隐含概念的分析方法有些课题的实质性内容往往很难从课题的名称上反映出来,课题所隐含的概念和相关的内容需要从课题所属的专业角度作深入分析,才能提炼出能够确切反映课题内容的检索概念。例如:"社会保障"包含"养老保险"、"失业保险"、"医疗保险"和"社会救济"等概念,如果要检索社会保障方面的文献,应该析出上述概念,才能保证文献的查全率。
3. 核心概念的选取有些检索词中已经含有的某些概念,在概念分析中应予以排除。例如:课题"公司劳动奖励、职工培训和养老保险制度管理的理论和实践",如果把"劳动奖励","职工培训","养老保险","公司","制度","管理"六个概念全部组配起来,则会造成大量文献漏检。实际上,劳动力资源管理已经包含了劳动奖励、职工培训和养老保险三个方面,而且,劳动力管理必然是针对该三个方面而言的。因此,本课题只须采用"劳动力资源"和"管理"这两个本质概念即可。
为了提高文献的检准率,应该从相应的规范词表中选择所需的检索词。并且在确定检索词时,除了要考虑反映主题概念的同义词、近义词等相关的检索词外,还要注意选择被选用检索词的缩写词和不同拼法的词,以避免漏检有关的文献。
4.3.3检索词的扩展、选择和处理
目前的计算机信息检索系统,还不具备智能思考的能力,还不会对所输入的检索词以及涉及的所有词进行自动、全面的检索,因此,必须在概念分析的基础上列出与概念有关的词,从中做出选择,并利用截词等方法对检索词予以归并。
1.相同概念的检索词的扩展 扩展相同概念的检索词的方法一般有同义词方法、主题词表方法和截词方法
(1) 同义词方法。在同一概念的范畴内,从语言角度,选择不同的名称、不同的拼写方法和单复数形式。不同的名称包括学名和俗名、简称和全称,商品名和物质或产品名,事物的代码和事物的学名。不同的拼写方法,以英语为例,包括英式英语和美式英语的区别。
(2)截词方法。当某些检索词词干相同、词义相近,但词尾或词中间有变化时(多数英语单词的单复数变化和英美不同拼写形式),可以采用截词方法扩展检索词。这种方法要求在词干后使用截词符。截词符一般包括"?"和"*"两种。具体采用什么形式,各个系统都有明确的规定。例如:在DIALOG系统中,截词符号有无限截词算符
("?") 和有限截词 ("??"和"?? ?")等多种,"?"有时还用做字符屏蔽符。
(3)主题词表方法  许多数据库都编有自己的主题词表。在数据库编有主题词表的情况下,应该尽量从词表中选择检索词。使用主题词表,不仅可以使检索词更加规范,提高检索结果的准确性,而且可以从同族词中选取更多的上位词、下位词、相关词,使获得的检索结果更为理想。
2.检索词的选择和处理 运用上述方法得到的词,首先应加以选择,即注意选用本专业通用的术语(应避免使用冷僻词和根据中文术语自译生造的词),然后以概念为单位,构成组面(facets)。例如:课题"东西方社会保障制度比较研究"的概念组面和检索词为:

--------------------------------------------------------------------------------

2 计算机信息检索的基本方法
 概念组面1:"社会保障"social security 概念组面2:"制度研究"system? Research
4.3.4数据库的选择
不同数据库的学科范围不同,检索指令不同,收费的标准也不同。所以,在检索之前应该阅读有关数据库的使用介绍,以便选择数据库时做到心中有数。
选择数据库,我们一般应该遵循以下几条原则
1.按照课题的检索要求和目的,选择收录文献种类多、专业覆盖面宽、年代跨度对口的数据库;
2.当需要查找最新文献信息时,选择数据更新周期短的数据库;
3.当还需要获取原文时,选取原文获取较容易的数据库;
4.在同时有多个数据库可供选择的情况下,应首先选择比较熟悉的数据库。
5.当几个数据库的内容交叉重复率比较高时,应选择检索费用比较低的数据库。
4.3.5检索策略构成和调整方法
在实际检索过程中,仅需一个检索词就能满足检索要求的情况并不很多。通常我们需要使用多个检索词构成检索策略,以满足由多概念组配而成的较为复杂课题的要求。
检索策略,又称提问逻辑,就是对多个检索词之间的相互关系和检索顺序作出的某种安排。构成检索策略就是运用计算机情报检索系统可以接受的方法,包括布尔逻辑算符、位置逻辑算符等方法,表达课题检索要求的过程。

1.布尔逻辑算符  规定检索词之间的逻辑关系的算符,称为布尔逻辑算符。布尔逻辑算符包括逻辑"或(OR)"、"与(AND)"和"非(NOT)"。
(1) 或(OR)运算符。也可用"+"代替,是用来组配具有同义或同族概念的词,如同义词、相关词等。其含义是,检出的记录中,至少含有两个检索词中的一个。OR算符的基本作用是扩大检索范围,增加命中文献量,提高检索结果的查全率,OR运算符还有一个去重的功能。在实际检索中,同一组面中含义相同的词,相互之间都使用OR运算符。另外,在使用截词方法检索具有相同词干的检索词时,这些词之间也自动地隐含了逻辑"或"的关系。
(2) 与(AND)运算符。也可用"*"代替,用来组配不同检索概念。其含义是检出的记录必须同时含有所有的检索词。AND算符的基本作用是缩小检索范围,减少命中文献量,提高检索结果的查准率。在实际检索中,不同概念组面之间以及同一组面内的不同含义的词之间通常使用AND算符。
(3) 非(NOT)运算符。也可用"-"代替,但在检索时建议使用NOT,以避免与词间的分隔符"-"混淆,NOT算符是排除含有某些词的记录的,即检出的记录中只能含有NOT算符前的检索词,但不能同时含有其后的词。NOT算符的基本作用是缩小检索范围,提高检索结果的查准率.
2. 位置算符  位置算符又称邻接算符(adjacent operators),适用于两个检索词以指定间隔距离或者指定的顺序出现的场合,比如,以词组形式表达的概念;彼此相邻的两个或两个以上的词;被禁用词或特殊符号分隔的词等。位置算符是调整检索策略的一种重要手段。按照两个检索词出现的顺序和距离,可以有多种位置算符,而且对同一种位置算符,检索系统不同,规定的位置算符也不同。例如,Compendex光盘数据库使用的位置算符"(N)"(表示其两侧的检索词必须紧密相连,除开空格和标点符号外,不得插入其它词或字母,两词的词序可以颠倒)、"(F)"(表示其两侧的检索词必须在同一字段(例如同在题目字段或文摘字段)中出现,两词的词序可以颠倒)、"(S)"(表示其两侧的检索词必须在同一句子中出现,两词的词序可以颠倒)和"(W)"(表示其两侧的检索词必须紧密相连,除开空格和标点符号外,不得插入其它词或字母,两词的词序不可以颠倒)四种。
3.字段限制字段限制也是调整检索策略的一种重要的手段。它是限定检索词必须在数据库记录中规定的字段范围内出现的文献,方为命中文献的一种检索方法。如果想指定在题名等字段中查找所希望的检索词,就需要使用字段限制。字段限制适用于在已有一定数量输出记录的基础上,通过指定字段的方法,减少输出篇数,提高检索结果的查准率的场合。由于字段限制采用前缀和后缀的形式,因此又称为前缀限制和后缀限制。例如Compendex光盘数据库基本字段限制的用法是在需要指定字段的检索词后加上后缀运算符"/"和段码。这个数据库辅助字段限制的用法是在需要指定字段的检索词(有时检索词须放在双引号内)之前加上段码和前缀运算符"="。

--------------------------------------------------------------------------------

3 计算机信息检索的基本方法
4. 检索策略的调整检索策略输入检索系统后,系统响应的检索结果有时不一定能满足课题检索的要求,例如:或者检出的篇数过多,而且不相关文献所占比例很大,或者检出的文献数量太少,有时甚至为零,这时就需要调整检索策略。
调整检索策略之前,首先要分析造成检索结果不理想的原因。对于输出篇数过多的情况,应分析是否是由下述原因造成的:①选用了多义性的检索词;②截词截得过短;③输入的检索词太少;④应该使用"与(AND)"的使用了"或(OR)";⑤优先运算符"()"使用错误。对于输出篇数过少的情况,应分析是否是由下述原因造成的:①检索词拼写错误;②遗漏重要的同义词或隐含概念;③检索词过于冷僻具体;④没有使用截词算符;⑤位置算符和字段算符使用的过多;⑥使用过多的"与(AND)"算符。
针对上述原因,如果是属于需要扩大检索范围,提高文献查全率,调整检索策略的方法有:①减少"与(AND)"算符,增加同义词或同族相关词使用逻辑或(OR)将它们连接起来;②在词干相同的单词后使用截词符(?);③去除已有的字段限制、位置算符限制(或者改用限制程度较小的位置算符)。
如果是属于缩小检索范围,提高文献查准率的,调整检索策略的方法有:①减少同义词或同族相关词;②增加限制概念,用逻辑与(AND)将它们连接起来;③使用字段限制,或者限定检索词在指定的基本字段,或者指定的辅助字段出现,限制检索结果的文献类型、语种、出版国家;④使用适当的位置算符;⑤使用"非(NOT)"算符,排除无关概念。
4.3.6输出格式和方式的选择
所谓输出格式的选择是对记录字段的选择。所谓输出方式的选择是指对屏幕显示、打印和存盘的选择。一般情况下,如果输出的是中间结果,属于基本字段的题目(TI)、文摘(AB)、叙词(DE)和识别词(ID)字段是必须的,这些字段有利于观察结果,对检索策略做进一步调整。如果是最终结果,可以根据时间、经费条件选择其中适用的格式。
输出方式的选择,要注意的问题是,数据库是否只允许打印、存盘选中的记录;在选定打印、存盘后,是否还须进一步选择"当前记录""全部记录""选中记录";另外如果是存盘,是否还有文件扩展名的限制。


在这个时代,你必须很努力,才能跳出“信息茧房”的怪圈
“信息茧房”是什么? 有人说它存在,有人说它不存在。有人说这个概念是虚的,有人说它确实存在 ,就像电磁场一样。关于它到底是虚的,还是实在的,人们各有各的观点和意见。这种现在,每时每刻都在影响着人们的性格和行为,对人们的意识形态和思维境域产生了巨大影响,同时也通过潜意识或者获得的...

什么是算法
算法(Algorithm)是指解题方案的准确而完整的描述,是一系列解决问题的清晰指令,算法代表着用系统的方法描述解决问题的策略机制。也就是说,能够对一定规范的输入,在有限时间内获得所要求的输出。如果一个算法有缺陷,或不适合于某个问题,执行这个算法将不会解决这个问题。不同的算法可能用不同的时间、...

2021吉林省公务员考试行测备考:资料分析之社会文化 ?
2.阅读能帮助我们冲破信息茧房 当前,计算机算法为人们获取信息带来便捷,但同时也形成了信息茧房,推送给你的永远是你最关注的,而你关注的话题可能最终成为一张网,阻碍你了解更广阔的世界。阅读能够帮助人们有效的摆脱信息茧房,不再仅仅关注当下的疫情,而是帮助人们跳出既有的视野和思维,以更加开阔的视野,更高的站位...

关于java新闻网站的算法
胡万鹏在《智能算法推荐的伦理风险及防范策略》中总结了从算法推送方面:针对新闻的价值观所受到的负面影响;以及新闻的公共性、客观性和真实性受到的削弱进行分析;从受众方面:将具体对信息茧房现象以及受众的知情权和被遗忘权展开探讨;从社会影响方面,则针对社会群体、社会公共领域和社会文化所受到的消极影响展开论述。根...

么是信息社会?信息社会有哪些主要特征
(2)在国民经济总产值中,信息经济所创产值与其它经济部门所创产值相比已占绝对优势;(2)能源消耗少,污染得以控制;(3)知识成为社会发展的巨大资源。2、社会、文化、生活方面的特征 (1)社会生活的计算机化、自动化;(2)拥有覆盖面极广的远程快速通讯网络系统以各类远程存取快捷、方便的数据中心...

急求 计算机相关方面的实验报告范文,推荐一些有范文的网站也行...
在基于XML的三层C\/S模型中,中间层一次性从远程数据库中获取满足客户需求的信息,生成相应的XML文档,以后中间层就不需要再与远程数据库进行交互了,即与远程数据库的连接也就终止了。一旦中间件软件把满足客户需要的信息组装起来以后,就可以以XML 形式发送给客户了,这样客户与中间层也就无需进一步交互。 同时,丰富的XM...

信息技术的发展从哪两个方面去理解?
“智慧地球”“智慧城市”等基于位置的应用模式的成熟和推广,本质上是信息技术和现代管理理念阳环境治理、交通管理、城市治理等领域的有机渗透。4.虚拟计算 在计算机领域,虚拟化( Virtualization)这种资源管理技术,是将计算机的各种实体资源,如服务器、网络、内存及存储等,抽象、捌装、规范化并呈现出来...

计算机问题
般地说,将分散的多台计算机、终端和外部设备用通信线路互联起来,彼此间实现互相通信,并且计算机的硬件、软件和数据资源大家都可以共同使用,实现资源共享的整个系统就叫做计算机网络。一、计算机网络面临的威胁计算机网络所面临的威胁大体可分为两种:一是对网络中信息的威胁;二是对网络中设备的威胁。影响计算机网络的因素很...

为啥日本会出现「情弱化(信息处理能力弱化)」现象?
二、娱乐与社交的偏差:信息茧房的影响 在学术领域,即使是计算机专业的研究生,也有可能对基本的PC使用技巧生疏,如一个在筑波大学升读的研究生,竟然对SQL一无所知,英语水平仅限于初中水平。这样的例子并非个例,一些人可能出于兴趣爱好,更倾向于手游和动漫,而非深入接触PC游戏,如《偶像活动》等。

零售数字化是什么?
您好!很高兴为您解答:数字化零售实际上就是依托于现代信息技术与智能工具《大数据、云计算、人工智能等》将零售价值链上所涉及的商品信息、物流信息、交易信息及用户信息等进行数字化整合,变成智能设备能够识别、计算、整合、优化的数据资产,通过这些数据资产与零售企业核心价值导向的结合来指导零售业态智能...

绿园区18846906136: 计算机信息检索 - 搜狗百科
芝蒋鼻渊: 1 计算机信息检索的基本方法4.3.1明确检索要求和检索目标 计算机检索的第一步准备工作是明确检索要求和检索目标.明确检索要求就是要搞清楚本课题属于什么学科,所需文献的类型及语种,查找文献的年代,所需文献的最佳篇数,允许支...

绿园区18846906136: 1.试述计算机信息检索的步骤,并举例说明.要字多的,而且要准确的,要快这两天要了 -
芝蒋鼻渊:[答案] (1)确定检索方向.这是使检索获得满意  结果的先决条件,为此必须弄清所需信息的 诸特征,如学科归属、主题概念、时间界限 、文献类型、国别和语种等. (2)确定检索方法.一般有三种方法:  a.正文法——从主题、分类、作者等途径 查找. b....

绿园区18846906136: 简述文献检索的作用及基本方法 -
芝蒋鼻渊:[答案] 文献检索(Information Retrieval),是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关的信息过程,所以它的全称又叫“信息的存储与检索(Information Storage and Retrieval),这是广义的信息检索.狭义的信息检索则仅指...

绿园区18846906136: 网络信息检索的策略与技巧 -
芝蒋鼻渊: 网络信息检索策略设计应遵循快、准、全及低成本的原则,以实现检索策略最优化.1、明确检索目标,确定检索项分析主题、使用布尔逻辑算符等构造检索式2、选择合适的检索系统根据检索主题和检索系统的特点选择检索系统3、正确对待检...

绿园区18846906136: 网络信息检索的方法有哪些?分析这些方法的差异性及其各自的优势? -
芝蒋鼻渊: 网络信息检索方法主要有以下四种:1、漫游法2、直接查找法3、搜索引擎法4、网络资源指南法1.漫游法(1)偶然发现.这是在因特网上发现、检索信息的原始方法.即在日常的网络阅读、漫游过程中,意外发现一些有用信息.这种方式的目...

绿园区18846906136: 专业文献的检索方法 -
芝蒋鼻渊: 1、直接法 又称常用法,是指直接利用检索系统(工具)检索文献信息的方法.它又分为顺查法、倒查法和抽查法.2、顺查法 顺查法是指按照时间的顺序,由远及近地利用检索系统进行文献信息检索的方法.这种方法能收集到某一课题的系统...

绿园区18846906136: 计算机信息检索技术包括哪些 -
芝蒋鼻渊: 计算机信息检索可以概括为两个部分:信息存储和信息检索. 1、信息存储目的是建立信息库,以备检索.为了便于查找,需要合理组织信息条目,可以按文件形式组织,也可以按数据库形式组织.信息检索系统常用的文件组织形式有:顺序文...

绿园区18846906136: 如何快速有效地检索到自己所需的文献 -
芝蒋鼻渊: 如果你所说的精确检索是指,已经知道文章的具体信息,如年代,作者,所在期刊的名称,卷,期,页码等信息,那么用 Single Citation Matcher 进行检索即可

绿园区18846906136: 计算机信息检索常用的检索命令有哪些 -
芝蒋鼻渊: 搜索关键词提炼选择搜索关键词的原则是,首先确定你所要达到的目标,在脑子e里要形成一z个m比4较清晰概念,即我要找的到底是什0么b?是资料性的文8档?还是某种产品或服务?然后再分4析这些信息都有些什6么l共性,以4及d区f别于g...

本站内容来自于网友发表,不代表本站立场,仅表示其个人看法,不对其真实性、正确性、有效性作任何的担保
相关事宜请发邮件给我们
© 星空见康网