如何度量两个词之间的语义相似度

作者&投稿:邱媛 (若有异议请与网页底部的电邮联系)
爱学习形容词语~

爱学习形容词语

一丝不苟 全神贯注 废寝忘食 专心致志 孜孜不倦 一丝不苟 一心一意 悬梁刺骨 凿壁偷光 囊萤映雪 闻鸡起舞 聚精会神 秉烛达旦 笃学好古、 牛角挂书, 发奋图强、持之以恒、 夜以继日. 好学不倦、 韦编三绝、 孜孜不倦、锲而不舍、持之以恒、 坚持不懈、滴水穿石、孜孜不倦 博览群书 豁然开朗 学而不厌 博学强记 不耻下问 孜孜不倦 循序渐进 融会贯通 各抒己见 集思广益 迎刃而解 手不释卷 书声琅琅 程门立雪 穿壁引光 春诵夏弦 读书破万卷 读书三到 读书三余 耳闻则诵 古为今用 囫囵吞枣 开卷有益 名落孙山 取长补短 取精用弘 然荻读书 融会贯通 入主出奴 三余读书 生吞活剥 书声琅琅 熟能生巧 似懂非懂 万世师表 文行出处 不耻下问,勤学苦练,勤能补拙, 将勤补拙,笃学不倦,笃实好学,

学海无涯、学无止境、不愧下学、不耻下问、博古通今
一、学海无涯 [ xué hǎi wú yá ]

【解释】:学海:知识。学问的海洋无边无际。
【出自】:明·张岱《小序》:“学海无边,书囊无底。”
【译文】:学问的海洋无边无际,装书的行李也没有底。
二、学无止境 [ xué wú zhǐ jìng ]

【解释】:指学业上是没有尽头的,应奋进不息。
【出自】:清·刘开《问说》:“理无专在,而学无止境也,然则问可少耶?”
【译文】:真理不是只在某些人手里,学习是没有止境的,既然这样,那么,问可以少得了吗
三、不愧下学 [ bù kuì xià xué ]

【解释】:不耻下问,虚心向地位低的人学习。
【出自】:西汉·刘向《战国策·齐策四》:“是以君王无羞亟问,不愧下学。”
【译文】:因此,君主不羞急忙问,虚心向地位低的人学习。
四、不耻下问 [ bù chǐ xià wèn ]

【解释】:乐于向学问或地位比自己低的人学习,而不觉得不好意思。
【出自】:春秋 孔子《论语·公冶长》:“敏而好学,不耻下问。”
【译文】:他聪敏勤勉而爱好学习,又谦虚下问
五、博古通今 [ bó gǔ tōng jīn ]

【解释】:通:通晓;博:广博,知道得多。对古代的事知道得很多,并且通晓现代的事情。形容知识丰富。
【出自】:春秋 孔子《孔子家语·观周》:“吾闻老聃博古知今。”
【译文】:我听说老子知识渊博

如何度量两个词之间的语义相似度
如何度量句子的语义相似度,很容易想到的是向量空间模型(VSM)和编辑距离的方法,比如A:“我爸是李刚”,B:“我儿子是李刚”,利用VSM方法A(我,爸,是,李刚)B(我,儿子,是,李刚),计算两个向量的夹角余弦值,不赘述;编辑距离就更好说了将“爸”,“儿子”分别替换掉,D(A,B)= replace_cost;

这是两种相当呆的方法,属于baseline中的baseline,换两个例子看一下就知道A:“楼房如何建造?”,B:“高尔夫球怎么打?”,C:“房子怎么盖?”,如果用VSM算很明显由于B,C中有共同的词“怎么”,所以BC相似度高于AC;编辑距离同理;

解决这种问题方法也不难,只要通过同义词词典对所有句子进行扩展,“如何”、“怎么”,“楼房”、“房子”都是同义词或者近义词,扩展后再算vsm或者edit distance对这一问题即可正解。这种方法一定程度上解决了召回率低的问题,但是扩展后引入噪声在所难免,尤其若原句中含有多义词时。例如:“打酱油”、“打毛衣”。在汉字中有些单字词表达了相当多的意义,在董振东先生的知网(hownet)中对这种类型汉字有很好的语义关系解释,通过hownet中词语到义元的树状结构可以对对词语粒度的形似度进行度量。

问题到这里似乎得到了不错的解答,但实际中远远不够。VSM的方法把句子中的词语看做相互独立的特征,忽略了句子序列关系、位置关系对句子语义的影响;Edit Distance考虑了句子中词语顺序关系,但是这种关系是机械的置换、移动、删除、添加,实际中每个词语表达了不同的信息量,同样的词语在不同词语组合中包含的信息量或者说表达的语义信息大不相同。What about 句法分析,计算句法树的相似度?这个比前两种方法更靠谱些,因为句法树很好的描述了词语在句子中的地位。实际效果要待实验证实。

对了,还有一种方法translation model,IBM在机器翻译领域的一大创举,需要有大量的语料库进行训练才能得到理想的翻译结果。当然包括中间词语对齐结果,如果能够利用web资源建立一个高质量的语料库对两两相似句对通过EM迭代词语对齐,由词语对齐生成句子相似度,这个。。想想还是不错的方法!


霍布斯《利维坦》(第四章)
相当于公正这一个词。 加上这些意义范围或大或小的名词之后,我们就把心中构想的事物序列的计算变成了名词序列的计算。举个例来说:一个人如果生来完全聋哑并一直保持这种状况,完全不能运用语言,那么当他把一个三角形摆在眼前,旁边再摆两个直角(如一个正方形的两个角)时,他就可能通过默想加以比较,发现这三角形...

语文翻译文言文的方法
二、具体方法:留、删、补、换、调、变。 “留”:就是保留。凡是古今意义相同的词,以及古代的人名、地名、物名、官名、国号、年号、度量衡单位等,翻译时可保留不变。 例如:《晏子使楚》中的“楚王”、“晏婴”、“晏子”等不用翻译。 “删”,就是删除。 删掉无须译出的文言虚词。例如:“寡人反取病焉”...

什么是比较级和最高级
相对二者的比较,还有三者及以上的比较,这时就产生了最高级。在英语中通常用下列方式表示的词:在形容词或副词前加more(如 more natural,more clearly )或加后缀 -er(newer,sooner )。典型的是指形容词或副词所表示的质、量或关系的增加。英语句子中,将比较两个主体的方法叫做“比较句型”。其中,...

怎么比较级和最高级?
比较级是由形容词原级转化而来,一般是在原级后面加er,也有一些不规则的转化,最高级是由形容词或副词转化而来,形容词的最高级前面要加定冠词the,副词最高级前面的the可以省略。下面为大家带来比较级和最高级的用法,快来看看吧。概念1、比较级用于两个人或物之间的比较,表示“较……”或“更……”,标志词“th...

两的组词大全(约50个) 两的词语解释_两是什么意思?
序数也只用“二”;如“第二、二哥”。在一般量词前;用“两”不用“二”。在传统的度量衡单位前;...精选部分两组词的词语造句及词语的拼音和详细解释: 1、两江造句:重庆在六月中旬主办了一场国际会议,...解释:(1)物体的两个边儿:这张纸~长短不齐。(2)两个方向或地方:这间屋子~有窗户,光线很好|老...

relate to和be related to有什么区别
“relate to” 是一个短语,常用作及物动词短语,表示能够理解、感同身受或与某事物产生共鸣。“be related to” 是一个动词短语,用于描述两个事物之间的关系或连接。下面给大家简单总结了两个词的区别及用法,大家了解一下哦。区别一:用法不同:“relate to” 是一个短语,常用作及物动词短语,...

描写宽容的佳句
随着社会的进步和改革开放,人们的生活水平逐渐宽裕的今天,宽容和包容这两个词进入人们视野的频率愈加频繁,特别是在建设和谐社会的大背景下,宽容与包容的内涵更加丰富和深刻。 哲学家康德说:“生气,是拿别人的错误惩罚自己”;戴尔·卡耐基说:“要真正憎恶别人的简单方法只有一个,既发挥对手的长处”。如果你憎恨对方,...

谁能解释一下这些词?
副词是一种用来修饰动词,形容词,副词或全句的词,说明时间,地点,程度,方式等概念。表示"多少"和"第几"的词,叫数词。冠词是虚词,本身不能单独使用,也没有词义,它用在名词的前面,帮助指明名词的含义。介词是一种用来表示词与词, 词与句之间的关系的词。连接词是一种虚词,不能单独作句子成分,只...

介词for和of有什么区别?
for 表原因、目的 of 表从属关系 简单说,of相当于“的”,for则表示用来干什么。介词of的用法 (1)所有关系 this is a picture of a classroom (2)部分关系 a piece of paper a cup of tea a glass of water a bottle of milk what kind of football,american of soccer?(3)描写...

什么叫做虚词和实词
可见“特别”是形容词,“格外”是副词。又如:可以说“意见一致”,也可以说“(一致)意见”,“一概”没有这种用法。能作谓语、定语、状语,而意义不变的是形容词,不能作谓语、定语的是副词。5.“白、怪、老、净”等,同名词组合时是形容词,同动词、形容词组合时是副词。因在两个位置上...

崇信县13498521427: 词汇级语义相似度计算有哪些方法 知乎 -
大季柯真瑞: 相关工作词汇相似度计算在信息检索、信息抽取、文本自动分类、词义消歧、机器翻译等领域有着广泛的应用.词汇相似度的计算方法大体上可以分成以下两类:a)利用大规模的语料进行统计.该方法将词汇上下文信息的概率分布作为词汇语义相似度计算的主要指标.

崇信县13498521427: 判断两个词语的相似性能用余弦相似度的方法吗 -
大季柯真瑞: (1)余弦相似性 通过测量两个向量之间的角的余弦值来度量它们之间的相似性.0度角的余弦值是1,而其他任何角度的余弦值都不大于1;并且其最小值是-1.从而两个向量之间的角度的余弦值确定两个向量是否大致指向相同的方向 .

崇信县13498521427: 如何实现相似度计算及在自然语言处理中的作用 -
大季柯真瑞: 作为自然语言理解的一项基础工作,词语语义相似度度量一直是研究的重点.语义相似度度量本身是一个中间任务,它是大多数自然语言处理任务中一个必不可少的中间层次,在自然语言处理中有着广泛的应用,如词义消歧、信息检索以及机器翻译等.

崇信县13498521427: 如何在汉语语料库里检测或计算两个词的相关性? -
大季柯真瑞: 如何在汉抄语语料库里检测或计算两个词的相关性:在书面汉语的语言事实中,不管是"规律"还是"例外",都符合一种"统计学的规律":例如一个"双音词",表现袭在书面上就是两个词,而且,这两个字必然经常连2113在一起出5261现;反之,如果两个字之间不构成一个词,那么4102,它们一般就不会经常在一起出现我们可以根据这个特点,找出字与字、词与词、字与词之间是否经常在一起出现的规律,也就是"字词相关性",将其推而广之,就1653可以发现书面汉语中的"词法"、"句法"甚至"章法"的组织与结构规律了

崇信县13498521427: 跪求~高手~~怎样用c++计算词语相似度~~C++的计算词语相似度都有哪些方法??? -
大季柯真瑞: 可以这样来设计:把有相似度的词语都放在一个数组里面作为数组的元素,如设a[n]={"电脑","微机",“计算机”……},检索的时候通过循环比较,若发现有和检索词相同的词,就输出数组其他的元素.

崇信县13498521427: 用wordnet来进行英语语义相似度计算,下了wordnet只是一个电子词典而已,那要怎么使用它进行相似度计算呀? -
大季柯真瑞: 我也了解不多,是要计算两个单词的相似度吗?反正WORDNET目前就是把单词分了很多类,可以查询指定单词的同义、反义、上位、包含等等关系的词,它可以由你输入的一个单词,按照你要求的关系,找到另一个或一堆词.

崇信县13498521427: 词向量:如何评价词向量的好坏 -
大季柯真瑞: 词向量:如何评价词向量的好坏 一、前言 词向量、词嵌入或者称为词的分布式表示,区别于以往的独热表示,已经成为自然语言任务中的一个重要工具,对于词向量并没有直接的方法可以评价其质量,下面介绍几种间接的方法.二、评价方法 ...

崇信县13498521427: 如何用 word2vec 计算两个句子之间的相似度 -
大季柯真瑞: FC——文件比较命令 1.功能:比较文件的异同,并列出差异处. 2.类型:外部命令 3.格式:FC[盘符:][路径名]〈文件名〉[盘符:][路径名][文件名][/A][/B][/C][/N] 4.使用说明: (1)选用/A参数,为ASCII码比较模式; (2)选用/B参数,为二进制比较模式; (3)选用/C参数,将大小写字符看成是相同的字符. (4)选用/N参数,在ASCII码比较方式下,显示相异处的行号. 不好意思,我还没有达到那个层次,只是dos学的时候比较认真一点,余弦定理的不会做!

崇信县13498521427: 一定程度上的同义词 -
大季柯真瑞: 一定程度上的同义词问题一:基本上的近义词基本上的近义词:差不多,差不离基本近义词:根基(注释:①基础:建筑房屋一定要把~打好.②比喻家底:咱们家~差,花钱可不能那样大手大脚.)基本(注释:①根本:人民是国家的~.②根...

本站内容来自于网友发表,不代表本站立场,仅表示其个人看法,不对其真实性、正确性、有效性作任何的担保
相关事宜请发邮件给我们
© 星空见康网