实力不靠吹骁龙8为AI做的这些幕后实事鲜为人知

作者&投稿：郗卢（若有异议请与网页底部的电邮联系）

~
“拍照优化、语音助手以外，手机AI还有什么?”
今年全新一代骁龙8移动平台发布时，高通再次翻译翻译了，什么叫脑洞大开——
让手机学会“听诊”，通过识别出用户可能存在的疾病，比如抑郁症、哮喘;
让手机实现“防偷窥”，通过识别陌生用户的视线，实现自动锁屏;
让手机游戏搞定超分辨率，将以往PC端才有能力运行的画质，搬到手机上体验
更重要的是，这些AI功能，骁龙8有能力**同时运行**!
高通声称，骁龙8搭载的第7代AI引擎，性能相比上一代最高提升了**4倍**。
这意味着我们玩手机的时候，同时“多开”几个AI应用也没问题。更重要的是，它不仅仅是简单的AI性能提升，更能给用户带来流畅的应用体验感。
在硬件制程升级如此艰难的今天，高通是如何在第7代AI引擎的性能和应用上“翻”出这么多新花样的?
我们翻了翻高通发表的一些研究论文和技术文档，从中找到了一些“蛛丝马迹”：
在高通发布的AIMET开源工具文档里，就有提到关于“如何压缩AI超分辨率模型”的信息;
在与“防偷窥”相关的一篇技术博客中，介绍了如何在隐私保护的前提下使用目标检测技术
而这些文档、技术博客背后的顶会论文，全都来自一家机构——高通AI研究院。
可以说，高通把不少研究院发表的AI论文，“藏”在了第7代AI引擎里。
顶会论文“藏身”手机AI
先来看看第7代AI引擎在**拍照算法**上的提升。
针对智能识别这个点，高通今年将面部特征识别点增加到了300个，能够捕捉到更为细微的表情变化。
但同时，高通又将人脸检测的速度提升了**300%**。这是怎么做到的?
在一篇高通发表在CVPR上的研究中，我们发现了答案。
在这篇文章中，高通提出了名为Skip-Convolutions(跳跃卷积)的新型卷积层，它能将前后两帧图像相减，并只对变化部分进行卷积。
没错，就像人的眼睛一样，更容易注意到“动起来的部分”。
这使得骁龙8在做目标检测、图像识别等实时检测视频流的算法时，能更专注于目标物体本身，同时将多余的算力用于提升精度。
可能你会问，这样细节的人脸识别对于拍照有什么用?
更进一步来说，这次高通与徕卡一起推出了LeicaLeitz滤镜，用的是基于AI的智能引擎，其中就包括了人脸检测等算法，使得用户能更不经思考智能地拍出更具艺术风格的照片。
不止人脸检测，高通在智能拍摄上所具备的功能，还包括超分辨率、多帧降噪、局部运动补偿
然而，在高分辨率拍摄中的视频流通常是实时的，AI引擎究竟如何智能处理这么大体量的数据?
同样是一篇CVPR论文，高通提出了一个由多个级联分类器组成的神经网络，可以随着视频帧的复杂度，来改变模型所用的神经元数量，自行控制计算量。
面对智能视频处理这种“量大复杂”的流程，AI现在也能hold住了。
智能拍照以外，高通的语音技术这次也是一个亮点。
像开头提到的，第7代AI引擎支持用手机加速分析用户声音模式，以确定哮喘、抑郁症等健康状况的风险。
那么，它究竟是如何准确分辨出用户声音，而且又不涉及收录数据的?
具体来说，高通提出了一种手机端的联邦学习方法，既能使用手机用户语音训练模型，同时保证语音数据隐私不被泄露。
像这样的AI功能，有不少还能在高通AI研究院发表的论文中找到。
同样也能寻到蛛丝马迹的，是开头提及的AI提升手机性能的理论支撑。这就不得不提到一个问题：
**同时运行这么多AI模型，高通究竟是怎么提升硬件的处理性能的?**
这里就不得不提到高通近几年的一个重点研究方向**“量化”**了。
从高通最新公布的技术路线图来看，模型量化一直是AI研究院这几年钻研的核心技术之一，目的就是给AI模型做个“瘦身”。
由于电量、算力、内存和散热能力受限，手机使用的AI模型和PC上的AI模型有很大不同。
在PC上，GPU动辄上百瓦功率，AI模型的计算可以使用16或32位浮点数(FP16、FP32)。而手机SoC只有几瓦功率，也难存储大体积AI模型。
这时候就需要将FP32模型缩小成8位整数(INT8)乃至4位整数(INT4)，同时确保模型精度不能有太大损失。
以AI抠图模型为例，我们以电脑处理器的算力，通常能实现十分精准的AI抠图，但相比之下，如果要用手机实现“差不多效果”的AI抠图，就得用到模型量化的方法。
为了让更多AI模型搭载到手机上，高通做了不少量化研究，发表在顶会上的论文就包括**免数据量化**DFQ、**四舍五入机制**AdaRound**，以及联合量化和修剪技术**贝叶斯位**BayesianBits等。
其中，DFQ是一种无数据量化技术，可以减少训练AI任务的时间，提高量化精度性能，在手机上最常见的视觉AI模型MobileNet上，DFQ达到了超越其他所有方法的最佳性能：
AdaRound则可以将复杂的Resnet18和Resnet50网络的权重量化为4位，大大减少了模型的存储空间，同时只损失不到1%的准确度：
贝叶斯位作为一种新的量化操作，不仅可以将位宽度翻倍，还能在每个新位宽度上量化全精度值和之前四舍五入值之间的残余误差，做到在准确性和效率之间提供更好的权衡。
这些技术不仅让更多AI模型能以**更低的功耗**在手机上运行，像原本只能在电脑上运行的游戏AI超分辨率*(类似DLSS)*，现在实现能在骁龙8上运行的效果;
甚至其中一些AI模型，还能“同时运行”，例如其中的姿态检测和人脸识别：
事实上，论文还只是其中的第一步。
要想快速将AI能力落地到更多应用上，同样还需要对应的更多平台和开源工具。
将更多AI能力释放到应用上
对此，高通保持一个开放的心态。
这些论文中高效搭建AI应用的方法和模型，高通AI研究院通过合作、开源等方法，将它们分享给了更多开发者社区和合作伙伴，我们也因此能在骁龙8上体验到更多有意思的功能和应用。
**一方面，高通与谷歌合作，将快速开发更多AI应用的能力分享给了开发者。**
高通在骁龙8上搭载了谷歌的VertexAINAS服务，还是每月更新的那种，意味着开发者在第7代AI引擎上开发的AI应用，其模型性能也能快速更新。
采用NAS，开发者就能自动用AI生成合适的模型，包括高通发表在顶会上的智能拍照算法、语音翻译、超分辨率都能包含在AI的“筛选范围”中，自动为开发者匹配最好的模型。
这里用上了高通的运动补偿和插帧等算法。而类似于这些的AI技术，开发者们也都能通过NAS实现，还能让它更好地适配骁龙8，不会出现“调教不力”的问题。
想象一下，你将来用搭载骁龙8的手机打游戏时，会感觉画面更流畅了，但是并不会因此掉更多的电(指增加功耗)：
同时，关于AI模型的维护也变得更简单。据谷歌表示，与其他平台相比，VertexAINAS训练模型所需的代码行数能减少近80%。
**另一方面，高通也已经将自己这些年研究量化积累的工具进行了开源。**
去年，高通就开源了一个名为AIMET*(AIModelEfficiencyToolkit)*的模型“提效”工具。
其中包含如神经网络剪枝、奇异值分解(SVD)等大量压缩和量化算法，有不少都是高通AI研究院发表的顶会论文成果。开发者用上AIMET工具后，就能直接用这些算法来提效自己的AI模型，让它更流畅地在手机上运行。
高通的量化能力也不止开源给普通开发者，同样能让头部AI企业的更多AI应用在骁龙8上实现。
在新骁龙8上，他们与NLP领域知名公司HuggingFace进行合作，让手机上的智能助手可以帮用户分析通知并推荐哪些可优先处理，让用户对最重要的通知一目了然。
在高通AI引擎上运行它们的情绪分析模型时，能做到比普通CPU速度快30倍。
正是技术研究的沉淀和技术上保持的开放态度，才有了高通不断刷新手机业界的各种AI“新脑洞”：
从之前的视频智能“消除”、智能会议静音，到今年的防窥屏、手机超分辨率
还有更多的论文、平台和开源工具实现的AI应用，也都被搭载在这次的AI引擎中。
而一直隐藏在这些研究背后的高通AI研究院，也随着第7代AI引擎的亮相而再次浮出水面。
高通AI的“软硬兼备”
大多数时候，我们对于高通AI的印象，似乎还停留在AI引擎的“硬件性能”上。
毕竟从2007年启动首个AI项目以来，高通一直在硬件性能上针对AI模型提升处理能力。
然而，高通在AI算法上的研究，同样也“早有筹谋”。
2018年，高通成立AI研究院，负责人是在AI领域久负盛名的理论学者MaxWelling，而他正是深度学习之父Hinton的学生。
据不完全统计，高通自成立AI研究院以来，已有数十篇论文发表在NeurIPS、ICLR、CVPR等AI顶级学术会议上。
其中，至少有4篇模型压缩论文已在手机AI端落地实现，还有许多计算机视觉、语音识别、隐私计算相关论文。
上述的第7代AI引擎，可以说只是高通近几年在AI算法研究成果上的一个缩影。
通过高通AI的研究成果，高通还成功将AI模型拓展到了诸多最前沿技术应用的场景上。
在自动驾驶上，高通推出了骁龙汽车数字平台，“包揽”了从芯片到AI算法的一条龙解决方案，目前已同25家以上的车企达成合作，使用他们方案的网联汽车数量已经达到2亿辆。
其中，宝马的下一代辅助驾驶系统和自动驾驶系统，就将采用高通的自动驾驶方案。
在XR上，高通发布SnapdragonSpacesXR了开发平台，用于开发头戴式AR眼镜等设备和应用。
通过和WannaKicks合作，骁龙8还将第7代AI引擎的能力带到了AR试穿APP上。
在无人机上，高通今年发布了FlightRB55G平台，其中有不少如360°避障、无人机摄影防抖等功能，都能通过平台搭载的AI模型实现。其中首架抵达火星的无人机“机智号”，搭载的就是高通提供的处理器和相关技术。
回过头看，不难发现这次高通在AI性能上不再强调硬件算力(TOPS)的提升，而是将软硬件作为一体，得出AI性能4倍提升的数据，并进一步强化AI应用体验的全方位落地。
这不仅表明高通更加注重用户实际体验的感受，也表明了高通对自身软件实力的信心，因为硬件已经不完全是高通AI能力的体现。
可以说骁龙8第7代AI引擎的升级，标志着高通AI软硬一体的开端。
最近，高通针对编解码器又提出了几篇最新的研究，分别登上了ICCV2021和ICLR2021。
这些论文中，高通同样用AI算法，展现了针对编解码器优化的新思路。
在一篇采用GAN原理的研究中，高通最新的编解码器算法让图像画面不仅更清晰、每帧也更小了，只需要14.5KB就能搞定：
相比之下，原本的编解码算法每帧压缩到16.4KB后，树林就会变得无比模糊：
而在另一篇用插帧的思路结合神经编解码器的论文中，高通选择将基于神经网络的P帧压缩和插帧补偿结合起来，利用AI预测插帧后需要进行的运动补偿。
经过测试，这种算法比谷歌之前在CVPR2020上保持的SOTA纪录更好，也要好于当前基于H.265标准实现开源编解码器的压缩性能。
将AI模型应用于更多领域中，高通已经不是第一次尝试，像视频编解码器的应用，就又是一个新的方向。
如果这些模型能成功被落地到平台甚至应用上，我们在设备上看视频的时候，也能真正做到不卡。
随着“软硬一体”的方案被继续进行下去，未来我们说不定真能看见这些最新的AI成果被应用到智能手机上。
结合高通在PC、汽车、XR等领域的“秀肌肉”
可以预见的是，你熟悉的高通、你熟悉的骁龙，肯定不会止于手机，其AI能力，也将不止于手机。

高通骁龙7和8谁好?
骁龙778G比骁龙7更好。以下是几个方面的详细比较：1. CPU性能：骁龙778G的CPU性能比骁龙7更强大。骁龙778G采用的是基于ARM Cortex-A78和Cortex-A55架构的定制八核Kryo 670 CPU，最高频率可达2.4GHz。而骁龙7则采用的是基于ARM Cortex-A76和Cortex-A55架构的定制八核Kryo 475 CPU，最高频率只有2...

骁龙8gen2相当于苹果的A几处理器?
而苹果的A16也只有195fps，骁龙8Gen2的GPU跑分竟然超过了苹果的A16处理器，这真的是历史性的一刻！除了CPU性能和GPU性能以外，高通骁龙8Gen2的AI性能也提升了50％，ISP也提升了不少，再加上领先的基带性能，如果到时候的功耗不翻车，那它有可能成为安卓历史上最扬眉吐气的一颗处理器了。

骁龙8gen3相当于苹果a几
对比之后就可以得出一个结论，高通骁龙8Gen3的单核能超越苹果A15，但是苹果A16还有10%的差距；高通骁龙8Gen3的多核完全超越苹果A16，A15更不在话下了。这样一对比就单核还是苹果牛，多核高通有质的进步了。骁龙8gen3相关介绍骁龙8Gen3是高通公司最新发布的旗舰处理器。该处理器的性能表现非常出色，...

手机处理器哪个型号好
最好的手机处理器型号是多种多样的，因为不同的处理器在不同用途和需求下表现可能会有所差异。但是总体上，骁龙8系列以及苹果A系列处理器表现优秀。以下是针对这些处理器型号的 1.骁龙8系列处理器：骁龙系列是高通公司的主打产品，而骁龙8作为高端系列，性能强大。它拥有高效的单核性能和多核性能，能够...

第一代骁龙8+算什么档次
音乐播放时长增加超17小时。骁龙8+为vivoXFold+带来芯片级安全隐私防护，具备软硬件全方位的安全保护能力支持。依托vivo与高通的深度联合调校，骁龙8+集成的高通安全处理单元（SPU）的性能得到全面释放，能够在更深层次上保护用户的信息、财产安全，满足金融级场景的安全要求。

骁龙8+什么水平
骁龙8+是高端水平处理器。骁龙8+是Qualcomm最新一代的手机处理器，它采用了先进的制程工艺和技术，具备出色的性能表现和效率。骁龙8+处理器在性能上有了很大的提升。它采用了最新的ARM Cortex-A系列核心架构，拥有更高的运行频率和更快的处理速度。这使得骁龙8+在处理复杂任务和多任务时表现出色，能够...

骁龙8gen2打得过A15吗?
是的，骁龙8Gen2处理器已经超越苹果A15。根据官方发布的数据，骁龙8Gen2处理器的性能比苹果A15处理器高出20%，而且它的功耗更低，只有苹果A15的一半。骁龙8gen2相当于苹果a几：骁龙8gen2大概相当于苹果a15。在传统的性能跑分测试中，它的性能已经能够和a15相媲美了，不过考虑能效比的话，还是要略差于...

全新一代骁龙8处理器排名
第四名：骁龙888，搭载最新一代5nm制作工艺，为用户带来最强的处理器性能，5nm的制作工艺，带来最为顶尖的技术、成本、功能性能要求。使用了超大核＋大核＋小核的三丛集架构，其中超大核为CortexX1，大核为CortexA78，小核为CortexA55。第五名：骁龙870，采用1*3.19GHz+3*2.42GHz+4*1.8GHz的八...

高通骁龙处理器最新排名
4、骁龙888plus 采用了三星的5nmlpe架构工艺，这也是目前最顶尖的工艺。采用了1+3+4八核的CPU架构，一个大核X1，主频为2.995GHz、三个中核A78，频率为2.42GHz、四个小核，A55运行频率为1.80GHz，这款处理器相比上一代888来说整体提升了不少，运速更快稳定性更高。5、骁龙888 搭载最新一代5...

麒麟990和骁龙8哪个好
骁龙8。1、麒麟990的频率4g版本为2个A76核心@2.86GHz+2个A76核心@2.09GHz+4个A55核心@1.86GHz。5G版本为2个A76核心@2.86GHz+2个A76核心@2.36GHz+4个A55核心@1.95GHz。2、骁龙8频率：Cortex-X2超大核（3.0GHz）+Cortex-A710，大核（2.5GHz）+Cortex-A510，小核（1.79GHz）组成。

华容区18076706406： 本届骁龙峰会最强CPU、最强终端侧生成式AI是亮点 ？
源曲优普： 全球最强性能CPU在一夜之间发生巨变,原本的王座被取代,引发行业热议.这一变化将对计算机行业产生深远影响,引发市场格局的重新洗牌.就在刚刚,骁龙峰会,...

华容区18076706406： 联发科,敌不过高通 ？
源曲优普： 联发科于11月6日发布了新一代旗舰移动平台天玑9300,该平台是MediaTek天玑旗... 用AI来增强图像、音频和传感器的运算,从骁龙8 Gen1开始,高通公司便愈发重视芯片...

华容区18076706406： 骁龙8相对于骁龙6有哪些提升? - ？
源曲优普： 首先,明确第三代骁龙8相比于第二代骁龙8在CPU、GPU和AI性能等方面有着显著提升.接下来将逐一解释这些差异.在CPU方面,第三代骁龙8采用了全新的Kryo 680 CPU核心,其时钟频率高达3.0GHz,相较于第二代骁龙8的2.84GHz有了明...

华容区18076706406： OPPO R11与OPPOR11sPlus哪个好? - ？
源曲优普： OPPO R11和R11Plus的各自优缺点从参数配置对比来看,OPPO R11和R11 Plus主要在屏幕大小、运行内存、电池容量、价格等几个方面有所区别.不难看出,R11 Plus是R11的放大升级版.版本方面,目前OPPO R11和R11 Plus均只有一个...

华容区18076706406： 小米折叠屏有几款 - ？
源曲优普： 2022年是折叠屏手机爆发的一年,目前,搭载第一代骁龙8+移动平台的折叠屏手机正在陆续问世.这些折叠屏旗舰在工业设计、影像和游戏体验等方面呈现了超高水准,同时也凭借得天独厚的折叠优势带来沉浸式大屏体验,其高效的交互方式...

华容区18076706406： 现在有什么手机推荐,荣耀v30,华为Nova6,iQOOPro和reno2这些怎么样? - ？
源曲优普： 华为nova 6和荣耀V30两款手机都挺不错的,手机参数信息如下: 1、屏幕:nova 6屏幕尺寸6.57英寸双摄极点全面屏.2400*1080 像素分辨率,色彩更为鲜明、视频更清晰.20:9全面屏,带来更加开阔的视野,以及身临其境的影视游戏体验....

华容区18076706406： 骁龙845和骁龙855哪个好 - ？
源曲优普： 首选第三代骁龙7在性能上优于第一代骁龙8. 首先,我们来看制造工艺.第三代骁龙7采用的是台积电的4nm工艺,而第一代骁龙8则使用的是三星的4nm工艺.虽然两者都是4nm工艺,但台积电的4nm工艺在晶体管密度、性能和功耗方面都要...

华容区18076706406： HelioP90相当于骁龙什么? ？
源曲优普： 联发科HelioP90参数如下:工艺制程:台积电12nmFinFETCPU规格:两颗2.2GhzA... 支持,业界首创AI人脸识别引擎性能方面,联发科HelioP90对标的是高通骁龙710处理...

华容区18076706406： 电脑cpu现在最好的是 - 电脑cpu现在最好的是哪款 ？
源曲优普： 1. 电脑cpu现在最好的是哪款HD530是核显,GTX960m是独立显卡.核显是指集成在... 这也是苹果一直以来以系统稳定性著称的一个实力,苹果的CPU是不外卖的,只进行...

你可能想看的相关专题

星空见康网

实力不靠吹骁龙8为AI做的这些幕后实事鲜为人知

你可能想看的相关专题