Involution:空间不共享?可完全替代卷积的高性能算子 | CVPR 2021

作者&投稿:微应 (若有异议请与网页底部的电邮联系)
~

论文: Involution: Inverting the Inherence of Convolution for Visual Recognition

  论文认为卷积操作有三个问题:

  为了解决上述的问题,论文提出了与卷积有相反属性的操作involution,核参数在空间上面特异,而在通道上面共享,主要有以下两个优点:

  一组involution核可表示为 ,这里的分组与卷积相反,增加分组是为了增加核的复杂性。对于像素 ,其involution核为 , 为involtion核的分组,组内核共享。involution的特征图输出通过对输入特征进行Multiply-Add操作得到:

  为通道编号,involution核的大小取决于输入特征图的大小,通过核生成函数 动态生成:

  为 对应的输入像素合集。

  为了简洁,论文直接从单个像素 生成对应的involution核 ,更复杂的结构也许能带来更好的性能,但不是当前主要的工作。定义核生成函数 : , :

  和 为线性变换,共同构成一个bottleneck结构, 为压缩因子, 为BN+非线性激活。

  公式4和公式6可表示为算法1和图1,在每个位置 通过核生成函数生成对应的involution核,再对该位置进行计算得到输出。
  在构建完整的网络时,以ResNet作为基础,将stem(开头)的bottleneck中的 卷积替换成 或 的involution,将trunk(后续)的bottleneck中的 卷积替换成 的involution, 卷积保留用作通道融合与扩展。
  Involution的优势在于通道信息在核生成时利用了起来,并且后续使用较大的感受野获得更大的空间信息。另外在使用时,前后的 卷积也增加了通道交互,从而提升了整体的性能。

  下面分别对involution进行两方面的探讨,分别是参数量下降的来源以及性能提升的来源。

  Involution的思想十分简洁,从卷积的通道特异、空间共享转换成通道共享、空间特异,我们从参数量和计算量两块来进行分析(不考虑bias和involution的G):

  因为标准卷积实际上会融合多个输入通道进行输出,而且通道不共享,导致参数量和计算量都很高。而分组卷积减少了标准卷积中输出通道与输入通道之间的大量关联,和invlotion在参数量和计算量上有十分相似的地方:

  的分组卷积即depthwise卷积, 的involution和depthwise卷积两者在结构上也可以认为是完全对立的,一个则通道共享、空间独立,另一个通道独立、空间共享,而在depthwise卷积上加上空间特异的属性即 的involution。但在之前很多的研究中,depthwise卷积一般都只用于轻量化网络的搭建,会牺牲部分准确率,而involution却能在减少部分参数量的同时提升准确率。我觉得除了空间特异带来大量参数之外,主要得益于两个部分设计:1)核大小增加到 。 2) 根据输入特征动态生成核参数。如果将depthwise卷积按类似的设置替换卷积核,不知道能否达到类似的结果。

  self-attention起源于nlp任务,目前在视觉上的应用十分火热,有不错的性能表现。将输入向量线性转化成查询项 、关键词项 以及值项 后,先用 计算出相似性,再对值项加权后输出,大致的公式为:

  如果将involution的核生成函数 看成是 的话,则可认为involution在某种意义上等同于self-attention,position encoding的信息也可认为是隐藏在了核生成函数里面,与生成的位置相关。文章花了很多篇幅去说明involution是self-attention的高层定义,有兴趣的可以去看看。不过我们只要理解,involution在特征图的不同位置动态生成了不同的核参数,功能上类似于self-attention中的attention即可,这也是involution能够提升准确率的关键。

  从实验结果来看,由involution搭建的ReaNet能够在准确率提升的情况下减少大量的参数,从实际速度来看,GPU速度与ResNet差不多,CPU速度则提升很大。

  论文创新地提出了与卷积特性完全相反的基础算子Involution,该算子在通道上共享,而在空间上特异,不仅能够大幅减少参数量,还集成了attention的特性,在速度和准确率上都有很不错的表现。






求一篇用法语介绍的中国名人
ZHANG XIAOGANG Zhang Xiaogang , n en 1958 a Kunming, est un artiste contemporain chinois. Il vit a Sichuang et Beijing. Zhang Xiaogang est clebre pour ses sries Bloodline, portraits styliss et souvent monochromatiques (noir et blanc) de familles chinoises. Les poses rappellent la...

突尼斯西北部埃尔克夫白垩系-第三系界线附近的事件序列
[6]P.F.Burollet and P.Sainfeld.Notice explicative de la feuille au 1\/50000 n°44 Le Kef.1956,32. [7]V.Courtillot.Deccan volcanism at the Cretaceous-Tertiary boundary:post climate crisis as a key to the future?.Palaeogeog.,Palaeoclimat.,Palaeoecol.(Global and Planetary Change Sect.),...

FOCUS系统多道反褶积模块的改进
其中n为地震记录长度,rgg(i)(i=1.2,…,n)为地震记录的自相关函数,a(i)(i=1.2,….n)为待求的反滤波因子。 用上述公式求出的反滤波因子与地震记录进行褶积运算所得到的反褶积结果接近于理想地震记录(反射系数序列),从而大大提高了纵向分辨率。在实际应用中,由于地震资料常存在零值或接近于零值的道,用上述...

参考文献
[15] Frost R L,Kristof J,Paroz G N,Kloprogge J T.Molecular structure of dimethyl sulfoxide intercalated kaolinites.J.Phys.Chem.B,1998,102:8519~8532.[16] Thompson J G.Interpretation of solid state13C and29Si nuclear magnetic resonance spectra of kaolinite intercalates....

推荐好歌!!
N 南拳妈妈:《香草把噗》《牡丹江》《人鱼的泪》 S S.H.E: 《Super Star》《China Girl》 《魔力》《Watch Me Shine》《让她爱你》《给我多一点》《长相思》《星光》《半糖主义》《痛快》《别说对不起》《一眼万年》《中国话》《听袁惟仁弹吉他》 水木年华:《一生有你》《再见了最爱的人》 山鹰组合:...

人的起源。
sian test of the rece nt Africa n origin the ory using the W LH·50 calvarium.Journal ofHuman Evolution ,2000,39:1~ 22.[44]Adcock G J,Dennis E S,Easteal S,Huttley G A,Jermiin L S,Peacock W J,Thorne A.Mitochondrial DNA sequences in ancientAustralians:Implications for mode rn ...

TV的音标是什么?
TV 英['ti:'vi:] 美['ti'vi] 翻译: 电视 n.电视;电视机 tv abbr. 1.television 电视机,电机学,电视广播事业 2.terminal velocity 终端速度,末速(度) 3.test vehicle 实验用飞行器,试验飞行器 4.tetrazolium violet 四唑紫 5.total volume 总量 6.transvestite 异性模仿欲,易...

达累斯萨拉姆的英文怎么说
Daughters of the American Ravolution (DAR) (1890) - U.S. patriotic society for direct descendants of soldiers or others who aided the cause of independence.美国革命女儿(1890)-美国爱国组织,会员仅限于美国革命时期的士兵或其它对独立事业出过力的人士的直系后裔。 salaam是什么意思:n. 额...

ipad是如何模拟乐器演奏音乐的?
下载音乐软件。之后就能模拟了。例如 Pianist Pro v1.9.1 - 钢琴家 D-Volution R'n'R v1.00 - 架子鼓 可以去51ipa下载

solurion什么意思
solution [英][səˈlu:ʃn][美][səˈluʃən]n.溶液; 解决; 溶解; 答案;复数:solutions形近词:solutizedilutionvolution 双语例句 1 Vitamins in solution are more affected than those in solid foods.溶液里的维生素比固体食物里的维生素受到的影响更...

罗湖区17690955538: 空间不能分享,也不提示动态,怎么回事?有谁知道?
贲吕伊迈: 在空间个人中心找到权限设置,然后你就知道该怎么办了

罗湖区17690955538: coreldraw中导出图片说磁盘空间不足或发生共享错误 -
贲吕伊迈: 有三个可能的原因:一是操作系统不稳定/或者有漏洞/或者需要重启一下电脑也有可能. 再或者,根本就是C盘空间真的不足- -||.建议可以查看一下或清理掉垃圾文件.二是你安装的CDR软件本身不稳定/或者需要重装新版本.三是你最好先详细检查一下你导出图片时的设置有没有问题: 1.格式. CDR虽然在导出的时候有一大堆备选文件格式的下拉列表,但有些格式兼容性并不好,的确很容易导出死机. 不过,通常较常用的几种图像格式还是比较靠谱的:JPG/GIF/TIF/BMG等等都还好.2.大小. 文件尺寸是否设置的过大,或者分辨率太高,以至于导出的图像文件过大.

罗湖区17690955538: 空间传不了共享文件
贲吕伊迈: 可能是群空间在维护,你直接在群里放共享就可以了,不用那么麻烦,希望采纳

罗湖区17690955538: 访问网上邻居的共享,出现“服务器存储空间不足,无法处理此命令”的提示 -
贲吕伊迈: 楼主你好:电脑打开某些网上邻居的东西或是打开某个文件夹时,总是提示“服务器存储空间不足,无法处理此命令 (Not enough server storage is available to process this command)”,原来曾经遇到相同的错误提示,原因是安装了某些...

罗湖区17690955538: 主人空间有权限,不允许分享是怎么设置的 -
贲吕伊迈: 若空间访问权限设置为非公开(“部分人可见、仅自己可见”),在空间或朋友网发表日志后,其他好友通过该动态进行转发时,则会提示“原文有权限,分享成功但不产生动态”,建议联系该日志的空间主人,将其空间的访问权限设置为公开,则转发时可

罗湖区17690955538: 让别人可以看我的空间,但是不能分享怎么设置
贲吕伊迈: 在空间里设置禁止转载或分享就可以了.

罗湖区17690955538: 我的空间没有显示转载和分享一栏,很多朋友无法转载和分享文章,如何解决这个问题,请求帮助!
贲吕伊迈: 要首先在你的设置中设定允许分享,才可以出现你的空间显示转载和分享一栏.否则是没有办法的. 谢谢采纳!

罗湖区17690955538: QQ情侣空间是不是共享好友呀 -
贲吕伊迈: 不是的,只是你的好友在看你空间的同时也能看到她的空间链接,这样的话方便你的好友进入你情侣的空间看看,好友是不共享的,谢谢采纳

罗湖区17690955538: oracle 导入导出时需要建立相同的用户名和表空间名吗,权限也必须一致吗 -
贲吕伊迈: oracle 导入导出有4种方式:系统方式、表空间方式、用户方式、表方式.系统方式和表空间方式需要超级用户权限,用户方式和表方式按普通用户权限就可以了.oracle 导入导出时无需建立相同的用户名和表空间名,但导入权限必须一致或大于导出权限.

罗湖区17690955538: 来宾帐户和主账户的硬盘空间是共享的吗?能不能在来宾帐户上安装软件? -
贲吕伊迈: 可以设置共享,默认是不共享的

本站内容来自于网友发表,不代表本站立场,仅表示其个人看法,不对其真实性、正确性、有效性作任何的担保
相关事宜请发邮件给我们
© 星空见康网