搜索引擎如何实现用户图片检索的需求?

作者&投稿:吕盆 (若有异议请与网页底部的电邮联系)
什么是搜索引擎?你是如何在Internet上搜索图片和文字资料的? 希望能给一个简单明了的答案~

搜索引擎(search engine)是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。
图片搜索引擎是全新的搜索引擎,目前国内有安图搜。基于图像形式特征的抽取:由图像分析软件自动抽取图像的颜色、形状、纹理等特征,建立特征索引库,用户只需将要查找的图像的大致特征描述出来,就可以找出与之具有相近特征的图像。这是一种基于图像特征层次的机械匹配,特别适用于检索目标明确的查询要求(例如对商标的检索)。产生的结果也是最接近用户要求的。但目前这种较成熟的检索技术主要应用于图像数据库的检索,在网上图像搜索引擎中应用这种检索技术还具有一定的困难。
工作原理
抓取网页
  每个独立的搜索引擎都有自己的网页抓取程序(spider)。Spider顺着网页中的超链接,连续地抓取网页。被抓取的网页被称之为网页快照。由于互联网中超链接的应用很普遍,理论上,从一定范围的网页出发,就能搜集到绝大多数的网页。
处理网页
  搜索引擎抓到网页后,还要做大量的预处理工作,才能提供检索服务。其中,最重要的就是提取关键词,建立索引文件。其他还包括去除重复网页、分词(中文)、判断网页类型、分析超链接、计算网页的重要度/丰富度等。
提供检索服务
  用户输入关键词进行检索,搜索引擎从索引数据库中找到匹配该关键词的网页;为了用户便于判断,除了网页标题和URL外,还会提供一段来自网页的摘要以及其他信息。

如何通过图片搜索图片

    针对输入有两种:

一、以文字搜图片

    在采集图片的时候,如果是来自网页HTML中的img标签,通常会有alt属性,作为图片的注解,这可以作为图片的标签,还可能有页面的标题。如果是普通的图片,没有alt,那通过图片分类器,对图片打上标签。

    有了图片对应的标签之后,文字搜图片的过程就变成了文字匹配标签的过程了,按照匹配度高低先后展示出来即可。


二、以图片搜图片

    这个一般指的是识图功能,即找到相似的图片,需要计算图片之间的相似度。

    首先需要缩小图片,灰化,然后取图片的hash,也就是图片的指纹。图片都是由像素组成,每个像素点都是由红绿蓝三原色(RGB)构成的,其中每种颜色取值为0~255,因此每个像素点的取值有16777216个(256^3),像素的大小信息会在文件格式中描述出来,假如说两张图片的所有像素点都一样,那肯定是同样的图片。但是这样的计算量太大了,而且也容不得一点、一像素的差异,而我们想要的其实是看起来一样的图片。因此需要提取出图片的hash,作为图片的特征。

    这类算法比较多,也是关键点,比如说:pHash(感知哈希算法),大致是缩小图片至8X8大小,去掉了图片尺寸明暗上的差异,灰化去掉颜色,然后计算平均灰度,将每个像素与平均灰度比较,大于等于计1,小于计0,这样的差值序列就是hash,作为图片的特征。

    pHash有对应的开源实现,然后还有SIFT、DCT等等算法。复杂的算法对抗图片的变形效果也会比较好。

    在得到hash之后,通过计算两者的汉明距离,取汉明距离小的作为相似图片,大概是要低于5,而高于某个阈值就认为不相似。




手机是怎么窃取我的隐私的?
1、搜 索、浏 览记录。当用户使用搜 索引擎进行搜 索时,手机会记录用户的搜索历史,从而了解用户感兴趣的话题和领域。手机会通过我们的搜 索历史记录来分析我们的兴趣爱好。当我们通过搜 索引 擎或者社 交 媒 体在网络上搜 索关 键词时,这些数据就会被手机收集,并被分析为我们的兴趣爱好、消费...

“用户搜索体验”说的是什么意思?
SEO是Search Engine Optimization的简称,SEO中文意思是搜索引擎优化.是建立在搜索引擎以用户搜索体验为中心的基础上,通过采用易于搜索引擎索引的技术手法,使网站链接结构更加清晰、网站内容表达主次分明,从而提供给用户良好的使用体验,进而获得搜索引擎的信任及对网页的全部收录并且给予关键词排名优先排序.SEO贯...

什么是搜索引擎优化
SEO(Search Engine Optimization)搜索引擎优化的英文缩写,是指通过采用易于搜索引擎索引的合理手段,使网站各项基本要素适合搜索引擎的检索原则并且对用户更友好(Search Engine Friendly),从seo而更容易被搜索引擎收录及优先排序。SEO[1]的中文意思是搜索引擎优化。通俗理解是:通过总结搜索引擎的排名规律,对网站进行合理...

如何用好搜索引擎?
搜索引擎:以HOTBOT为例,它自动生成搜索队列,用户在他们找到的站点中进行搜索,所以,如果网页出现变化,引擎可以自动发现这些变化并修正该页在搜索队列中的位置。 目录:以Yahoo为例,它依靠人力实现搜索队列,站点向目录提供一个关于站点的简短描述,或引擎编辑为他们发现的站点进行一个文字介绍,而引擎...

做一个搜索引擎要涉及那些知识?求专家建议
3.元搜索引擎:这类搜索引擎没有自己的数据,而是将用户的查询请求同时向多个搜 索引擎递交,将返回的结果进行重复排除、重新排序等处理后,作为自己的结果返回给用 户。服务方式为面向网页的全文检索。这类搜索引擎的优点是返回结果的信息量更大、更 全,缺点是不能够充分使用所使用搜索引擎的功能,用户需要做更...

收索引擎特性
谷歌的搜索特性和百度一样都是用spider收索,你收索出来的东西是关于你收索的关键字的重要性来定的 关于雅虎,这个收索引擎是全人工化的,能够跟你收索的完全相同就会出来,只有关键字的则不会出来 关于新牛元我没有怎么接触过,所以不清楚

什么是收索引擎
搜索引擎(Search Engine)是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。很高兴为你解答本题,没问题的话,请及时点击右上角的采纳满意哈~

综合搜索引擎有哪些
问题一:常用的搜索引擎有哪些? 索引擎(search engines)是对互联网上的信息资源进行搜集整理,然后供你查询的系统,它包括信息搜集、信息整理和用户查询三部分。 搜索引擎是一个为你提供信息“检索”服务的网站,它使用某些程序把因特网上的所有信息归类以帮助人们在茫茫网海中搜寻到所需要的信息。 早期的搜索引擎是...

急。。。搜索引擎是一个程序还是文档还是网页还是什么的?只要告诉我...
搜索引擎按其工作的方式分为两类:一类是分类目录型的检索,把因特网中的资源收集起来,由其提供的资源的类型不同而分成不同的目录,再一层层地进行分类,人们要找自己想要的信息可按他们的分类一层层进入,就能最后到达目的地,找到自己想要的信息;另一类是基于关键词的检索,这种方式用户可以用逻辑...

常用的搜索引擎有哪些
索引擎(search engines)是对互联网上的信息资源进行搜集整理,然后供你查询的系统,它包括信息搜集、信息整理和用户查询三部分。 搜索引擎是一个为你提供信息“检索”服务的网站,它使用某些程序把因特网上的所有信息归类以帮助人们在茫茫网海中搜寻到所需要的信息。 早期的搜索引擎是把因特网中的资源服务器的地址收...

齐齐哈尔市18687403303: 大多数商业搜索引擎是如何准许用户搜索图片的 -
仲长侍毅达: 图片有一个alt属性 属性就是图片的含义、内容 用户搜索相关内容 就会展示这种意思的图片

齐齐哈尔市18687403303: 7 什么是搜索引擎?如何在Internet上搜索图片和文字资料的? -
仲长侍毅达: 搜索引擎的概念 搜索引擎是指以一定的策略搜集互联网上的信息,在对信息进行组织和处理后,为用户提供检索服务的系统.从使用者的角度看,搜索引擎提供一个包含搜索框的页面,在搜索框输入词语,通过浏览器提交给搜索引擎后,搜索引擎就会返回跟用户输入的内容相关的信息列表.互联网发展早期,以雅虎为代表的网站分类目录查询非常流行.网站分类目录由人工整理维护,精选互联网上的优秀网站,并简要描述,分类放置到不同目录下.用户查询时,通过一层层的点击来查找自己想找的网站.也有人把这种基于目录的检索服务网站成为搜索引擎,但从严格意义上,它并不是搜索引擎. 每个搜索引擎都有网页和图片专栏的,点击进入,然后输入你想搜索的东西就可以了 采纳我的答案吧!!!

齐齐哈尔市18687403303: 请问图片识别搜索引擎的相关功能是如何实现的? -
仲长侍毅达: 那么,怎么做呢,就是从像素中提取特征,特征有各种各样的提取方法,这也是每种算法性能不同的主要原因.但是简单来说,可以理解为将像素或者像素间关系翻译为有代表性的表达方法.特征能在编码方式不同,受到噪音攻击或其他各种攻...

齐齐哈尔市18687403303: 如何让自己的文章及图片等在百度上被搜索到?
仲长侍毅达: 要想让你的网站和搜索引擎相处融洽,并让用户尽可能准确地获得所需信息,在设计页面时掌握一些与搜索引擎有关的基本技巧还是非常必要的.不论是通过商业软件建立的网站内部的搜索引擎还是一些公共的搜索引擎(比如Google),其实它...

齐齐哈尔市18687403303: 收索引擎,当用户输入关键字时点击收索.后台是如何执行并找到用户所需要的资源的?
仲长侍毅达: 查询数据库.搜索引擎会从互联网提取各个网站的信息(以网页文字为主),建立起数据库,并能检索与用户查询条件相匹配的记录,按一定的排列顺序返回结果.

齐齐哈尔市18687403303: 搜索引擎是如何提取图片的?有什么技巧更能够被收索到? -
仲长侍毅达: 这需要先了解搜索引擎的工作原理:(如下,你也可以在百科里好好查查相关类容)最重要的是:关键字要独到我经常在淘宝上买衣服,有些搜索的心得,搜索的时候比较注意卖家的信誉(几钻)、关键字(如09秋装最新上市)、风格(如韩版...

齐齐哈尔市18687403303: 搜索引擎是怎么工作的 -
仲长侍毅达: 搜索引擎的基本工作原理包括如下三个过程:首先在互联网中发现、搜集网页信息;同时对信息进行提取和组织建立索引库;再由检索器根据用户输入的查询关键字,在索引库中快速检出文档,进行文档与查询的相关度评价,对将要输出的结果...

齐齐哈尔市18687403303: 用搜索引擎查找网上信息有哪些模式 -
仲长侍毅达: 一般会有如下三点方式:一,关注一些新闻,机构等,都是发布最重要的资讯点;二,想要查看相关的重要信息,或是新闻一类的,直接到一些专业的站点上查看;三,直接通过大型搜索引擎平台,进行在线输入关键词搜索.

齐齐哈尔市18687403303: 什么是搜索引擎?搜索引擎如何如何工作? -
仲长侍毅达: 搜索引擎指自动从英特网搜集信息,经过一定整理以后,提供给用户进行查询的系统.英特网上的信息浩瀚万千,而且毫无秩序,所有的信息象汪洋上的一个个小岛,网页链接是这些小岛之间纵横交错的桥梁,而搜索引擎,则为你绘制一幅一目...

本站内容来自于网友发表,不代表本站立场,仅表示其个人看法,不对其真实性、正确性、有效性作任何的担保
相关事宜请发邮件给我们
© 星空见康网