尝试梳理下ARM处理器的发展历史?

作者&投稿:希功 (若有异议请与网页底部的电邮联系)
~

ARM架构,过去称作进阶精简指令集机器(Advanced RISC Machine,更早称作:Acorn RISC Machine),是一个32位精简指令集(RISC)处理器架构,被广泛地使用在嵌入式系统设计。今天我们一起来看一下它的发展历史是怎么样的。

1.前言

本文尝试简单梳理一下ARM处理器的发展历史、架构的演进,包括不同处理器的应用方向,但我们重点还是围绕Cortex-A系列展开,也会介绍不同微架构处理器之间的继承关系,以及它们分别出自哪个设计团队等。不出意外,这将会是一个系列,分别是ARM处理器及架构发展概述、ARMV7-A架构以及微架构分析、ARMv8-A架构以及微架构分析,一些关键技术如Trustzone/big.LITTLE/NEON/AMBA、以及整个ARM软件生态的总体情况分析等。

2.ARM处理器发展历史及商业模式

ARM的前身是英国剑桥的Acorn Computers,1990年正式成立,从1997年发布具有里程碑意义的ARM9后,从此进入快速发展的阶段。

ARM架构是当今世界上应用最广的RISC处理器架构之一,凭借其开放架构授权的商业模式,以低功耗为特点,是嵌入式和移动处理器领域绝对的霸主。除了CPU,ARM还会提供Mali GPU、符合AMBA协议的总线设计、一些常见外设IP,包括配套软件等一整套SoC解决方案。ARM的商业模式为IP授权,即通过知识产权授权的方式,收取一次性技术授权费用和版税提成。但ARM只专注于设计CPU/GPU等IP的设计,代工或生产由被授权的客户自行解决。

ARM收入包括前期授权费(license)和版税(Royalty),其中版税是按照使用ARM的芯片的出货量,按比例抽成。

ARM提供授权的方式有这么几种:

(1)处理器授权:是最低的授权层级,指授权合作厂商使用ARM设计好的处理器,对方不能改变原有设计,但可以根据需要调整如产品的频率、功耗等。

(2)POP(Processor Optimization Pack,处理器优化包)授权:处理器授权的高级形式,ARM出售优化后的处理器给授权合作厂商,方便其在特定工艺下设计、生产出性能有保证的处理器,如为三星、德州仪器、博通、飞思卡尔、富士通等基于ARM处理器推出自己的芯片。

(3)架构/指令集层级授权:可以对ARM架构或ARM指令集进行改造以实现自行设计处理器,如高通的Krait架构和苹果的Swift架构等。

3.ARM处理器架构发展概述

ARMv6主要特性

(1)Thumb-2:是对32位ARM指令集的扩充,它的目标是为了实现更高的代码密度。

(2)TrustZone:安全扩展,将物理资源隔离,分为Secure word和nNormal word,处理器通过SMC指令,可以在两个世界之间切换。该扩展需要总线、MMU的支持,DDR、SRAM、外设等也需要不同的IP来做控制,以实现安全隔离。

(3)SIMD:这一代SIMD指令集依赖的向量寄存器,复用了ARM本身的通用寄存器。支持8/16bit整数,可以实现4个8bit整数或者2个16bit整数的并行计算。

ARMv7主要特性

(1)高级SIMD:在ARM v7-A架构中,ARM进一步发展自身的SIMD指令集,并命名为NEON。这一代的指令集,有32个64bit的NEON向量寄存器,同时也支持单精度浮点。

(2)VFPv3/v4:浮点体系结构(VFP)为半精度、单精度和双精度浮点运算中的浮点操作提供硬件支持,符合IEEE-754标准,VFPv4相当于VPPv3主要增加了half-precision extension和乘加的指令。ARM的vfp可以实现为32个或16个double-word register,分别以VFPv3-D32和VFPv3-D16来表示。当NEON和VFP同时实现时,VFP只可以实现为VFP-D32。

(3)LPAE(Large Physical Address Extension):大地址扩展,一般为40位地址扩展,可以将寻址范围从2^32 4GB扩展到2^40 1TB,也有处理器后来扩展到44bit。

(4)Virtualization:在Normal world里面加入了一个新的CPU模式——HYP mode,需要MMU和GIC(中断控制器)分别提供IPA(Intermediate Physical Address)和虚拟中断的转发的支持。

ARMv8主要特性

(1)Secure EL2:该特性Armv8.4-A引入,在Secure word增加了虚拟化支持。

(2)PA(Pointer Authentication):v8.3引入,增强安全,函数指针检查,CPU在执行函数跳转时检查函数指针是否正确(使用MAC算法),防止跳转指针被修改。

(3)BTI(Branch Target Identifiers):v8.5引入,对间接跳转的目标进行限制。与PA结合使用极大程度减少控制流攻击。

(4)MTE(Memory Tagging Extension):v8.5引入,内存区域进行标记,对保护区域访问必须使用具有相同标记的指针。可检测溢出、UAF类漏洞。

(5)Scalar Floating Point:aarch64提供32个128-bit寄存器用于SIMD vector and scalar floating-point支持;aarch32提供32个64-bit寄存器用于SIMD vector and scalar floating-point支持。

(6)Enhanced Crypto:v8一开始就增加了cryptography指令,包括AES,SHA-1/SHA-256等算法实现,又在v8.4增加了“SHA3/SHA512/SM3/SM4”的支持。

(7)bfloat:v8.2引入,增加FP16数据处理指令。

(8)Vector Extensions:v8.2引入,Scalable Vector Extension(SVE)是arm AArch64架构下的下一代SIMD指令集,旨在加速高性能计算,允许vector从28到2048 bit长度可变。

(9)Improved virtualization support:v8.4引入。

ARMv9主要特性

Improved Security:主要是引入了全新的CCA(confidential compute architecture,机密计算架构)架构。机密计算可以打造基于硬件的安全运行环境来执行计算,保护部分敏感数据和代码,甚至不受特权软件的影响,即使是具有最高权限的OS也无法影响。虽然OS可以决定何时运行,但应用程序位于独立的硬件保护内存区域,和系统中的一切是隔离的。这意味着就算应用感染了恶意软件,也不会传播给设备里的其他部分。

Digital Signal Processing&Machine Learning:在ARMv8.2中引入SVE,但它的问题在于,新的可变矢量长度SIMD指令集的第一次迭代的范围相当有限,并且更多地针对HPC工作负载,缺少了许多仍由NEON涵盖的更通用的指令。SVE2,旨在通过用所需指令补充新的可扩展SIMD指令集来解决此问题,以服务于类似DSP/ML等目前仍在使用NEON的工作负载。除了增加的各种现代SIMD功能外,SVE和SVE2的优势还在于其可变的向量大小。

范围覆盖了128bits到2048bits,让其无论在什么硬件运行,都允许向量的可变粒度为128b。如果纯粹从向量处理和编程的角度来看,这意味着软件开发人员将只需要编译一次其代码,并且如果将来某个CPU带有本地的512b SIMD execution pipelines,该代码将能够充分利用单元的整个宽度。同样,相同的代码将能够在具有较低硬件执行宽度能力的保守设计上运行,这对于Arm设计从物联网、移动到数据中心的CPU而言至关重要。

在保留Arm体系结构的32bits编码空间的同时,它还可以完成所有这些工作。然而类似X86这样的架构则需要根据矢量尺寸增加新的指令和扩展。

4.ARM处理器分类及应用领域

ARM处理器现在产品线主要有Cortex-A、Cortex-R、Cortex-M、SecureCore、Neoverse等几个系列。

Cortex-A系列处理器

Application Processors(应用处理器),主要面向移动计算,智能手机领域,2011年引入big.LITTLE,至2017年演化为DynamIQ。该系列历经ARMv7、ARMv8和ARMv9(上图并没有列出全部ARMv8处理器和ARMv9处理器,后面会有介绍)。系列支持基于内存管理单元(MMU)的虚拟内存系统体系结构(VMSA)。ARMv8它支持A64、A32和T32指令集,ARMv9开始已不再支持32位指令集。

Cortex-R系列处理器

Real-time Processors(实时处理器),面向实时应用的高性能处理器系列,例如硬盘控制器,汽车传动系统和Modem基带等,该系列主要支持基于内存保护单元(MPU)的受保护内存系统体系结构(PMSA)。它支持A32和T32指令集。但最新的是Cortex-R82处理器,是64bit,带MMU,支持RichOS,支持NEON

Cortex-M系列处理器

Microcontroller Processors(微控制器处理器),微控制器处理器通常设计成面积很小和能效比很高。通常这些处理器的流水线很短,最高时钟频率相对较低,它支持T32指令集的变种。主要面向IOT物联网领域。

SecureCore系列处理器

SecureCore,基于ARM-M架构,增强了嵌入式安全,主要有SC000和SC300,分别基于Cortex-M0(v6-M)和Cortex-M3(v7-M)。

Neoverse系列处理器

Neoverse(服务器端),面向云端到边缘的HPC、AI/ML加速等领域,是Cortex之外的另一条面向服务器和基础设施设备的核心IP。如初代发布即收获不错市场反响的Neoverse N1核心IP,亚马逊Graviton2、Ampere Altra是基于IP设计的产品。

ARM处理器的发展历史如下所示:

其他应用领域

ARM的汽车增强(AE)IP系列产品,于2018年推出Cortex-A76AE处理器,主要用于汽车ADAS(高级驾驶员辅助)系统,其支持Split-Lock分离-锁定技术,使得CPU核心可以运行在不同的模式下,分离模式下性能最大化,锁定模式下两个核心/线程可以互相锁定,最大程度确保安全。除了安全性能之外,Cortex-A65AE处理器还是ARM首个支持SMT多线程技术的,SMT为了提高数据吞吐率。

因为ADAS除了安全和性能外,还需要处理大量传感器带来大计算负载及高吞吐量。据ARM宣称,Cortex-A65AE处理器在能效更高的情况下吞吐率比前代(Cortex-A53)提升3.5倍。2020年,ARM又推出了新的Cortex-A78AE,新产品带来了更高性能的CPU内核,还首次采用了AE级GPU Mali-G78AE和ISP Mali-C71AE。新的Cortex-A78AE基于Cortex-A78微架构,与上一代Corex-A76AE相比,IPC提升了30%。

苹果在2020年11月,发布了基于ARM处理器的MAC便携机,该SoC芯片为M1。另外,根据网上资料,高通基于ARM处理器的PC芯片应该会在这两年推出。

5.ARM Cortex-A系列处理器

ARM Cortex-A系列处理器细分

ARM Cortex-A系列处理器目前主要有超低功耗核、小核、大核、超大核4个系列,我们主要关注ARMv7、ARMv8和ARMv9这三代架构的处理器。

(1)超低功耗的处理器有:ARMv7架构的A5和A7,ARMv8架构的A35、A32和A34。

(2)作为小核的处理器有:ARMv7架构的A8和A9,ARMv8架构的A53和A55,以及ARMv9架构的A510。

(3)作为大核的处理器有:ARMv7架构的A15和A17,ARMv8架构的A57、A72、A73、A75、A76、A77和A78,以及ARMv9架构的A710和A715。

(4)作为超大核的处理器有:ARMv8架构的X1,以及ARMv9架构的X2和X3。

2011年有了big.LITTLE技术出来以后,ARMv7架构的A7可以作为小核和A15/17作为大核搭配;2012年ARMv8架构的A53作为小核和A57/A72/A73搭配使用;当然有了A35后,A53/A55也可以作为大核与A35作为小核搭配使用;2017年big.LITTLE进化为DynamIQ,大小核的搭配更为灵活多变,A75到A78都可以作为大核与A55进行搭配,此时出现了1+3+4(1个超大核、3个大核和4个小核)的搭配,一般用大核超频当做超大核用。

直到2020年ARM发布Cortex-X1,才有了真正意义上的超大核,定义是“可定制”移动平台,芯片商可以根据预算和需求向ARM提出要求,然后ARM再根据不同的应用场景调整各个模块的规格设计,当然也需要单独的授权。Cortex-X2/X3应该都是公版了(这块存疑)。最新的搭配可以有1个X3(超大核)+3个A715(大核)+4个A510(小核)这样的组合。

ARM Cortex-A系列处理器演进关系

从整体演进关系我们可以看到A9分为:A5往下的系列CPU(超低功耗路线)、A15(大核和超大核)、A12/17(未演进?)、A7分支(小核)这么几个分支;其中大核从A77又分化成传统大核和Cotex-X系列的超大核。

大核演进路线为:A8->A9->A15->A57->A72->A73->A75->A76>A77->A78->A710->A715。

超大核是从A77这一支线分叉出来的,分别为A77->X1->X2->X3。

小核的演进路线为:A9->A7->A53->A55>A73->A510。

超低功耗核的演进路线为:A9->A5->A35->A32/A34。

ARM处理器设计团队

ARM处理器主要出自Austin、Sophia、Cambridge三个Team之手,主要处理器如下:

一、Austin(Texas)

(1)Cortex-A8,Cortex-A15,Cortex-A57,Cortex-A72,Cortex-A76,Cortex-A77,Cortex-A78。

(2)Cortex-X1,Cortex-X2,Cortex-X3。

(3)Neoverse N1,Neoverse N2,Neoverse V1。

二、Sophia-Antipolis(France)

ARM11,Cortex-A9,Cortex-A12,Cortex-A17,Cortex-A73,Cortex-A75。

三、Cambridge(UK)

Cortex-A5,Cortex-A7,Cortex-A53,Cortex-A35,Cortex-A55。

另外,从网上公开资料看,Cortex-A76AE是美国Arizona州Chandler design centre设计的,其他面向汽车领域的处理器如Cortex-A65E/A78E是否为该团队设计暂未可知。




尝试梳理下ARM处理器的发展历史?
ARM处理器的发展历史如下所示: 其他应用领域 ARM的汽车增强(AE)IP系列产品,于2018年推出Cortex-A76AE处理器,主要用于汽车ADAS(高级驾驶员辅助)系统,其支持Split-Lock分离-锁定技术,使得CPU核心可以运行在不同的模式下,分离模式下性能最大化,锁定模式下两个核心\/线程可以互相锁定,最大程度确保安全。除了安全性能之外...

到底什么是Cortex、ARMv8、arm架构、ARM指令集、soc?一文帮你梳理基础概...
ARM内核是处理器的核心部分,包括寄存器、指令集、总线等,由ARM公司设计并授权给芯片制造商。例如,Cortex-A系列针对高性能应用,Cortex-M系列适用于低功耗微控制器。ARM指令集架构历经多代发展,从ARMv1到ARMv8,如Cortex-A系列的A78就基于ARMv8.2指令集。SoC,即System-on-a-Chip,是一种集成多...

现在脑子乱掉了。ARM指令集,x86指令集。。这些是汇编语言的一部分吗?还...
不用的处理器架构有不同的汇编语言。ARM有ARM汇编,X86有X86汇编,MIPS有MIPS汇编。电脑上用的intel处理器,基本都是x86的。手机,平板级别的产品,处理器基本都是ARM家族的。

arm入门,高手指点下~
买个ARM11的开发板, 先根据所配资料例子做实验, 充实各方面的术语、概念, 不懂上网搜查资料别随便问别人。基本程序看懂了系统看一些教程梳理一遍,再温故知新。这么一个来回下来,基本要半年时间,可以说入门了。

捋一捋国内CPU设计公司
——高性能RISC-V的前沿阵地芯至科技(中兴微电子团队)——自主研发的Core新星博瑞晶芯(ARM中国团队)——ARM与自研的融合海光——X86与Zen技术的交汇点海思——RISC-V与ARM的多面手龙芯——LongArch核心的坚定推动者ARM SoC的阵营:<\/遇贤微电子——ARM SoC的高端选择芯擎科技(华芯通团队)——ARM ...

吴雄昂能否翻盘?-从法律视角看安谋科技控制权之争
1、软银通过ARM公司对安谋 科技 进行的工商变更登记是否合法? 2、厚朴公司违反其与其他中资股东之间的一致行动人协议,与ARM联手作出新的股东会决议和董事会决议,ARM公司是否构成善意第三人? 3、安谋 科技 完成工商变更登记后,吴雄昂拒不配合交接,是在耍流氓还是在合法维权? 4、在吴雄昂不同意主动让位的情况下,软...

fpga开发工程师岗位职责极简版
fpga开发工程师岗位职责(一).负责开发4G\/5G移动通信产品的RU\/DU(射频单元\/数字单元)中FPGA\/ASIC开发 .负责CPRI\/DDC\/DUC\/CFR\/DPD\/JESD\/DU\/NR\/等各功能模块中一个或多个模块的开发和调试验证 fpga开发工程师岗位职责(二)1、 负责产品硬件、固件和嵌入式软件的开发;2、 负责FPGA、ARM平台开发和调试...

员工对未来工作的规划范文
工作规划是员工对未来工作表达期望的主要载体,能帮助员工实现对未来工作的规划,以下是我精心推荐的一些员工对未来工作的规划 范文 ,一起来学习下吧! 员工对未来工作的规划范文(一) 一、自我分析 (1) 性格 经过测试的结果,我的性格是具有友善、负责、认真、忠于职守的特点,只要我认为应该做的事,不管有多少麻烦都...

高中英语动词词组的总结
感冒catchone’sword听懂某人的话catchsightof发现,瞥见catchupwith赶上,追及,追上.以come为中心的词组comeacross偶尔发现,想起;越过;偿付comealong一道来,陪伴;进步,进展;出现comeat达到,求得,得到;扑向,袭击comeback回来;恢复,复原comedown倒下;降落;跌落;病倒comefrom来自,起源于,从~~...

嵌入式方向和软件开发方向
(3)针对linux内核,直接在开发机上make menuconfig ARCH=arm,配置选择该型号的SD驱动支持,前提是你已经开发好了SD卡驱动了。(4)使用开发PC机ubuntu上已经安装好了的arm-linux-GCC编译器直接编译针对开发板的内核:make ARCH=arm。(5)烧录内核:将编译后生成的内核文件通过串口现在,usb下载,tftp...

铁东区18520801764: arm的历史发展 -
牛世治咳: 1978年12月5日,物理学家赫尔曼·豪泽(Hermann Hauser)和工程师Chris Curry,在英国剑桥创办了CPU公司(Cambridge Processing Unit),主要业务是为当地市场供应电子设备.1979年,CPU公司改名为Acorn计算机公司.起初,...

铁东区18520801764: ARM处理器的发展路线是怎样的,现在学习开发应该选择哪种呢?最热门的是哪个,谢谢
牛世治咳: ARM处理器经历了从ARM7、ARM9到现在的Cortex-A9这样的历程,如下图:目前最热门的处理器当属三星Exynos 4412,性能强大,资料丰富,并且价格已回落到和ARM11等相当的水平,新产品建议采用.

铁东区18520801764: 各阶段ARM处理器的介绍尤其是跟音视频处理有关的 -
牛世治咳: ARM核的大概分三个阶段, 第一个阶段不是很清楚,那时ARM在中国也不出名,就是ARM7之前的时间.就是ARM1到ARM6. 第二个阶段就是ARM7到ARM11,这个时期ARM的性能和名气都大大提高.除了ARM8以外,其他都很成功. 低速度...

铁东区18520801764: 谁能介绍下ARM架构的历史呢?
牛世治咳: 如果觉的我答案有用,请点赞. 即使在ARM以一般认定为慢速的速度下执行,与更复杂的CPU设计相比它仍能执行得不错

铁东区18520801764: 谁能介绍下ARM的发展历史呢?
牛世治咳: ARM商品模式的强大之处在于它在世界范围有超过100个的合作伙伴(Partners)

铁东区18520801764: arm的介绍 -
牛世治咳: ARM是全球领先的半导体知识产权 (IP) 提供商.全世界超过95%的智能手机和平板电脑都采用ARM架构1.ARM设计了大量高性价比、耗能低的RISC处理器、相关技术及软件.2014年基于ARM技术的全年全球出货量是120亿颗,从诞生到现在为止基于ARM技术的芯片有600亿颗2.技术具有性能高、成本低和能耗省的特点.在智能机、平板电脑、嵌入控制、多媒体数字等处理器领域拥有主导地位.

铁东区18520801764: arm处理器 ,arm芯片,arm板,及cpu 的定义及关系? 座等大神.(不要介绍ARM的历史!!) -
牛世治咳: 英国ARM公司提供了ARM的IP解决方案, ARM处理器是这个方案中的处理器部分,也是核心部分. 很多大的芯片公司都license了ARM的IP,制作自己的ARM芯片,这些芯片在工艺,制程,甚至一些技术细节上(例如浮点单元,流水线,cache,TCM)都有自己的不同,最典型的就是XScale的多媒体扩展指令. 很多ARM芯片都是SOC,即把GPU,DSP等集成到一个芯片上,降低layout的难度和BOM成本从而提升竞争力.至于CPU,ARM处理器算是一个CPU的形式吧,是CPU中RISK的一种.

铁东区18520801764: arm的发展历史 -
牛世治咳: 1.1 it的本质及其发展历史 soa的服务的理念思想,本质上是一种业务和技术的完全分离,业务又能和技术自由组合的思想.它达到了目前软件设计思想的最高境界.soa的出现,预示着一个以服务为导向的新的it时代的到来. 软件发展的方向和...

铁东区18520801764: armv7(关于armv7的基本详情介绍)
牛世治咳: 1、ARM Cortex?-A7 MPCore?处理器ARM迄今为止开发的最有效的应用处理器,它显著扩展了ARM在未来入门级智能手机、平板电脑以及其他高级移动设备方面的低功...

铁东区18520801764: Arm处理器有多少种? -
牛世治咳: ARM公司商业模式的强大之处在于它在世界范围有超过100个的合作伙伴(Partners).ARM 公司采用转让许可证制度,由合作伙伴生产芯片. ARM 授权厂家:Freescale(飞思卡尔)、Atmel、Broadcom、Cirrus Logic、Qualcomm(高通)...

本站内容来自于网友发表,不代表本站立场,仅表示其个人看法,不对其真实性、正确性、有效性作任何的担保
相关事宜请发邮件给我们
© 星空见康网