分析 丨AI算法愈加复杂,但是机器视觉的开发门槛在降低

作者&投稿:尚嘉 (若有异议请与网页底部的电邮联系)
~ 机器视觉系统依赖于机器学习(machine learn)和深度学习(deep learn),尤其是深度学习的重要分支“卷积神经网络”在图像识别领域的应用,使机器视觉能够从原始像素数据中直接学习特征并准确判断。此外,AI大模型近两年受到关注,也可能被引入机器视觉领域,在跨模态理解和推理等方面展现出更强能力。

AI算法的复杂程度越来越高,机器视觉系统设计面临挑战,然而,从各种开发资源来看,机器视觉系统开发不会更难,或许会更加容易。

标准模块、系统级模块(SOM)易用性提升

首先是各种标准化的机器视觉模块(如智能相机、视觉传感器、3D相机)集成了必要的成像元件、图像处理器和通信接口,用户可以直接通过软件配置或二次开发实现所需功能,减少底层硬件设计和集成的工作量。

其次,系统模块(System on Module,SOM)易用性提升,可用于加速机器视觉项目开发。SOM相当于一个高度集成的小型计算机主板的核心部分,包括CPU、GPU、RAM和一些基本电路,可以直接将SOM插入载板,进行功能扩展、连接外部设备,快速构建功能完备的嵌入式系统或产品原型。

下面介绍几款可用于机器视觉系统开发的SOM:

1. NVIDIA Jetson

NVIDIA Jetson利用AI为机器人开发、智能视频分析、机器视觉和自主机器的未来提供动力支持。NVIDIA Jetson系列模组是紧凑而高性能的计算机,辅以NVIDIA JetPack™ SDK,可加速软件开发。在边缘生成式AI、NVIDIA Metropolis和Isaac平台的支持下,Jetson提供可扩展的软件、现代AI堆栈、灵活的微服务和API、生产就绪型ROS软件包以及触手可及的特定于应用程序的AI工作流。Jetson还与其他NVIDIA平台无缝集成,共享AI软件和云原生工作流。此外,它还拥有构建软件定义自主机器和突破性边缘AI解决方案所需的节能性能。每个NVIDIA Jetson都是一个完整的SOM,包括GPU、CPU、内存、电源管理和高速接口等。

2. Xilinx Kria K26 SOM

Kria K26 SOM为满足当前和未来市场对视觉AI和视频分析的需求而设计,搭载基于Zynq® UltraScale+™ MPSoC架构的自适应SoC以及支持该SoC所需的所有基本组件,比如存储器和电源等。Kria K26 SOM搭配一款简单的专为最终用户设计的载卡,该卡集成了用户终端系统具体使用的连接组件和附加组件,量产部署的定制也简便易行。

3. 瑞萨电子SOM解决方案

从视觉的采集、处理、分析和理解中生成数字元数据需要具有AI的高性能MPU。瑞萨电子的SOM解决方案使开发人员能够管理这些关键决策流程。系统优势:高性能双核Arm® Cortex®-A53 MPU;专用高速硬件AI推理(DRP-AI);符合SMARC 2.1标准的设计。

4. 基于瑞芯微RK3588的SOM

RK3588 S15是一款专门面向AI机器视觉应用的SOM,支持安卓、Linux和鸿蒙OS,体积小巧,方便用于便携式设备开发,如UAV、智能头盔、工业机器人、市政机器人等产品开发。RK3588采用8nm制程的8核心CPU,集成G61GPU、大算力NPU和8K VPU,可为机器视觉应用提供强力支撑。S15核心板已将RK3588的全部功能接口引出,丰富的接口设计也有助于快速落地相关产品。

除了瑞芯微之外,基于晶晨、全志科技、地平线、寒武纪、海思处理器芯片的SOM也有不少,这些产品通常是下游合作方推出的针对机器视觉应用的定制化产品,这里不做赘述。

图注:面向AI机器视觉应用的核心板SOM RK3588 S15(图源:ScenSmart) 单板计算机、开源软件库普及 单板计算机(Single Board Computer,SBC)与开源软件库结合,也可以加速机器视觉系统的开发进程。

单板计算机提供高性价比硬件解决方案,集成了处理器、内存、输入输出接口以及必要的多媒体处理能力,能直接运行复杂图像处理和深度学习算法。快速使用SBC搭建原型系统进行实验和验证,降低机器视觉项目的启动门槛。SBC另一个优势是,庞大的用户社区和技术支持,共享硬件驱动程序、操作系统镜像、应用程序实例及教程,为机器视觉应用的开发提供了便利。

常见的SBC品牌比如飞腾派、树莓派、Arduino、BeagleBone、赛昉科技的昉·星光系列RISC-V架构单板计算机、Firefly(萤火虫)等。

图注:飞腾派与树莓派的特性(图源:中电港公众号)

此外,诸如OpenCV、TensorFlow、PyTorch等开源机器视觉和深度学习框架的出现,使得开发者无需从零开始构建复杂的图像处理算法,这些工具包提供了丰富的预训练模型、API函数以及易于使用的编程接口,极大简化视觉应用的开发流程。

将单板计算机与开源软件库结合,开发者可以在一个相对较低的成本下,迅速构建和迭代机器视觉解决方案,实现从原型验证到产品化部署的快速转换。以飞腾派和OpenCV开发机器视觉为例,飞腾派本身采用飞腾自主研发的高能效异构多核处理器技术,具有模块化、易上手、全开源、低成本的特点,可通过OpenCV在飞腾派板子的移植编译与交叉编译,快速启动机器视觉的开发。关于飞腾派机器视觉的开发代码、开发流程等,可以在芯查查社区查询。

图注:飞腾派应用案例——智能机械臂通过AI+机械臂将垃圾分类放置在对应的垃圾桶(图源:飞腾官网) 云服务提升开发效率 云计算服务提供商也推出了包含机器视觉功能的服务,允许用户通过API调用进行图像识别和分析,无需在本地部署复杂的基础设施。云服务的基本作用是数据存储与管理、计算资源扩展、模型训练平台、服务化部署等。主要的云服务包括:阿里云视觉智能开放平台,提供图像识别、物体检测、内容审核等多种机器视觉API服务。腾讯云计算机视觉服务提供多种视觉分析服务,包括图像识别、人脸识别、文字识别、内容审核等。百度大脑视觉技术提供了基于百度大脑的计算机视觉技术,如通用物体及场景识别、图像搜索、人体分析等服务。华为云视觉智能服务推出多个视觉相关的云服务,例如图像识别、视频分析、OCR等,适用于工业质检、安防监控等多个领域。

小结 随着系统模组SOM、单板计算机SBC的发展,以及各类开源软件库的广泛应用,机器视觉系统的开发难度得到了显著降低,更多的开发者和企业能够在有限的技术资源下快速进入这一领域,推动了机器视觉技术在各行各业的普及和创新应用。


东昌府区13364119531: 人工智能的发展怎么样?
鄂琦安洛: 人工智能是计算机科学的一个分支,英文缩写为AI(Artificial Intelligence).人工智能的目的在于尝试使用计算机技术生产出与人类智能相似的智能机器,包括但不仅限于人工智能机器人、语言识别、图像识别等系统.人工智能的智能表现在对人的...

东昌府区13364119531: 人工智能和机器人有什么区别? -
鄂琦安洛: 机器人只是人工智能的一个载体.人工智能(AI): 它是计算机科学的一个分支.它涉及开发计算机程序来完成否则需要人类智能的任务.AI算法可以解决学习,感知,问题解决,语言理解和逻辑推理.AI在现代世界中以许多方式使用.例如,AI算法用于Google搜索,Amazon推荐引擎和SatNav路线查找器.大多数AI程序不用于控制机器人.即使AI用于控制机器人,AI算法也只是较大的机器人系统的一部分,它还包括传感器,执行器和非AI编程. 机器人: 是可编程机器,通常能够自主地或半自主地执行一系列动作.构成机器人有三个重要因素,:机器人通过传感器和执行器与物理世界进行交互.机器人是可编程的.机器人通常是自主或半自主的.

东昌府区13364119531: 现在人工智能怎么样?
鄂琦安洛: 人工智能现在已经得到了国家的大力支持,在人工智能行业因为有着强大的计算能力以及深度学习模型的建立等因素下,让人工智能算法的领域实现了重大的突破,而人工智能发展前景是分析深度学习应用的可用数据,来提高机器的更智能化,...

东昌府区13364119531: 急!!! 人工智能的特点 -
鄂琦安洛: 前面那位不知从哪里粘来了典型的国内少数装13学者的长篇废话.现在人工智能大约分几种方法,1.search, 2. Learning, 3. Fuzzy logic reasoning, 4. probability model, 5. Artificial immune system,(注意, 不是artificial intelligence). 6. probability ...

东昌府区13364119531: 如何看待人机共同进化? -
鄂琦安洛: 机器学习目前虽已取得长足进步,但仍需配合更好的算法应对更多挑战.随着AI对社会影响越来越大,人类需要相应提高自己的技能,机器如何帮助人类学习同样值得关注.在人机共生生态体系中,人与机器相互学习,持续学习,才会实现最好的效果.强大的计算能力、算法和大数据是AI技术的三大核心,在微软,机器学习已经被用于数据发掘和可视化、聊天机器人等各方面.随着人工智能对社会的影响越来越大,更多挑战需要人们去研究、去攻克.无论对人还是机器来说,我们都进入了持续学习的时代.学习过程永远需要时间、数据和老师,而在学习过程中,机器和人类将一同进化.

东昌府区13364119531: 人工智能0基础学习好学吗?
鄂琦安洛: 1、打好基础,学习高数和Python编程语言 高等数学是学习人工智能的基础,因为人工智能里面会设计很多数据、算法的问题,而这些算法又是数学推导出来,所以你要理解算法,就需要先学习一部分高数知识.先将高等数学基础知识学透,从...

东昌府区13364119531: 人脑比电脑复杂、精妙,但是运算速度却远不及电脑.为什么? -
鄂琦安洛: 人的大脑 或是说任何一个智能系统 ,都可以看作是一个 检索系统(就像百度百科的那个搜索框)还有一个 有大量标签的数据库(就像一个个词条) 电脑从研发开始就是经过科研人员仔细斟酌后 镶入高效算法 制作而成的,它的检索系统因为算...

东昌府区13364119531: 人工智能时代,人要怎样不会被机器所替代 -
鄂琦安洛: 近两年,科技在人工智能、机器人等领域飞速发展.阿尔法狗战胜围棋高手李世石,把机器智能算法推向新高.最近有不少高中家长和小编聊起孩子考大学选专业,大多表示很迷茫,不知道未来学什么专业孩子才不会被飞速发展的科技淘汰而失...

东昌府区13364119531: 人工智能的前景怎么样?
鄂琦安洛: 人工智能(Artificial Intelligence),英文缩写为AI.它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学.人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类...

东昌府区13364119531: 人们对人工智能的偏见为什么可能是一件好事 -
鄂琦安洛: 尽管人们喜欢谈论人工智能(AI)和机器学习能够完成比人类做的更好的事情,但事实是人工智能和机器学习只是加速了人类正常工作的速度.正如关于人工智能偏见的一篇深思熟虑的文章所写的那样,“当人们开始构建机器学习模型时,将会...

本站内容来自于网友发表,不代表本站立场,仅表示其个人看法,不对其真实性、正确性、有效性作任何的担保
相关事宜请发邮件给我们
© 星空见康网