在上一波移动应用的发展浪潮中,Arm抓住了移动计算的红利,成为全球半导体芯片IP龙头。面向未来更细分、更复杂的应用场景需求,IP市场竞争趋于细化,一方面新的开源架构正在崛起,另一方面,其他IP玩家也在通过持续的优化升级强化专长。

 

面向下一波计算浪潮,IP行业格局会否被重塑?Arm高筑壁垒的意志可见一斑。今年以来,先是通过Armv9升级架构,日前,又发布了全新的全面计算战略,通过全平台的产品组合和升级,以进一步挖深、挖宽护城河。 

 

Arm 高级副总裁兼终端设备事业部总经理Paul Williamson先容,这是Arm历年来最大阵容的产品发布,这些产品都是基于全新的Armv9架构。全面计算解决方案旨在针对不同的应用场景提供更优的解决方案,实现更快的速度,打造更好的用户体验。

 


全面计算为未来计算平台提供基础

 

其实在2019年,Arm就提出要在共同架构下推动全面计算。Arm当时所看到的是:产业发展已经来到关键的十字路口,业界在解决整合问题时面临一个重大挑战:单个IP与碎片化的解决方案在优化时面临挑战。

 

这意味着,在解决系统创新设计的挑战时,要从IP设计开始就在思考方式上做出重大转变。Arm的关注焦点从单一的产品演进,转化为以应用场景与体验为导向的系统解决方案,对IP、App以及工具本身以及彼此的协作进行全面优化。

 

Arm全新的IP设计思路可以归纳为两点:一是以应用场景、消费者体验与生态系统的需求为核心,二是深度聚焦在性能、安全性与开发人员介入权的优化。从而为未来的计算平台提供安全的基础,提升性能与效率,给予开发人员通过整个Arm生态系统获取更多性能的机会。

 

Paul Williamson表示,在全面计算的概念下,IP的PPA也许不再是最重要的,反而是系统级的性能尤为重要。此外,要确保开发者拥有最佳的开发体验、并且对每一台设备的性能与安全功能都有更简易的取用途径。


再提全面计算有何不同?

 

时隔两年,Arm再次提出全面计算有了更为清晰的产品布局和更为完善的路线图,全新的IP套件包括:首批 Armv9 Cortex CPU、出货量持续位居全球榜首的Mali GPU 和全新的 CoreLink 系统 IP。

 

Arm Cortex CPU:全面计算解决方案的基石 

 

最新推出的Armv9架构,成为Arm面向未来计算进行整体规划的重要基石。三款基于Armv9架构的CPU核包括:旗舰级Cortex-X2、大核 CPU Cortex-A710、高效率小核Cortex-A510。

 

其中,Cortex-X2 主要面向智能手机市场,比当前旗舰型安卓智能手机的性能还高出 30%。除了峰值性能外,Cortex-X2 还可在旗舰智能手机和笔记本电脑之间扩展,使合作伙伴可以根据市场需求来设计基于不同场景的计算能力。

 

Cortex-A710 是首款基于Armv9 架构的大核CPU,与Cortex-A78相比,能效提升30%,性能提升10%。通过性能和效率的提升,当智能手机运行高要求的App时,用户将获得比以往更长的使用时间以及更优化的体验。

 

Cortex-A510是Arm 过去四年来推出的首款高效率小核,其性能提升35%,机器学习性能提升超过3倍。它所带来的性能水平已经接近几年前推出的上一代大核Cortex-A73,性能差距不到10%,但能效优化可达35%,适用于智能手机、家用设备和可穿戴设备。

 

 

据Paul Williamson先容,在Arm发布Cortex-X1前,普遍为“4大核+4小核”的结构设计。发布X1后,出现了“2超大核+2大核+4小核”或“1超大核+3大核+4小核”的Tri-Cluster CPU架,不同的架构组合分别应对不同的负载需求。

 

在消费应用中常见的“1超大核+3大核+4小核”的架构中,如果将X1替换为X2,A78替换为A710,A55替换为A510,DSU替换为DSU-110。通过对比Armv8.2世代和Armv9世代,预计尖峰性能将会提升30%,持续性能将会提升30%,小负载性能将会提升35%。

 


面向细分市场的新款 Arm Mali GPU套件 

 

视觉体验仍然是消费者与设备交互、并享用设备的关键,Arm 新推出面向广泛应用的多款 GPU,搭配Armv9 CPU,继续提升用户体验。

 

最新的Arm Mali-G710 是针对旗舰智能手机和Chromebook笔记本市场的高性能 GPU,在计算密集型体验方面的性能提升 20%(如AAA高保真游戏)。对于与机器学习有关的任务(如全新相机和视频模式的图像增强),Mali-G710 也带来35%的机器学习性能提升。

 

Mali-G610可以说是一款次旗舰GPU,继承了Mali-G710 的功能,但价格更低,可将高阶应用场景带给更多的开发者和消费者。

 

Arm Mali-G510 实现了性能和效率的较好平衡,在中端智能手机、旗舰智能电视和机顶盒上,实现了100%的性能提升以及22%的节能优化,从而延长了电池续航时间,提升了100% 的机器学习性能。

 

Arm Mali-G310 是Arm目前最高效的GPU,以最小的面积成本提供了最高的性能。通过 Mali-G310,Valhall 架构和高质量图形技术将被引入到更低成本的设备中,例如入门级智能手机、AR 设备和可穿戴设备。
 


提升系统性能的互连技术

 

互连技术对于提高系统性能至关重要。最新的CoreLink CI-700一致性互连技术和CoreLink NI-700片上网络互连技术,可与 Arm CPU、GPU和NPU IP无缝搭配,跨 SoC 解决方案增强系统性能。CoreLink CI-700 和 CoreLink NI-700 对新的 Armv9-A 功能提供硬件级支撑,如内存标签扩展(Memory Tagging Extension),支撑更高的安全性、改进的带宽和延迟。

 

 

可以看出,全新的全面计算解决方案是系统范围内整体优化的思路,横跨硬件 IP、物理 IP、App、工具和标准,能够为合作伙伴提供更为广泛的选择,以满足细分市场的应用场景和成本区间需求。同时,这也将解锁整个生态系统的新体验,例如,专为移动设备设计、支撑 AI 功能的交互式应用场景,可以使用户身临其境观看电视8K 内容等体验。


2023年移动应用仅提供 64 位大、小核

 

随着IP战略的升级,Arm宣布,将在2023 年,面向移动应用仅提供64位的大核和小核。为此,Arm全球合作伙伴正在努力确保所有App都将在今年年底前支撑 64 位。

 

据Paul Williamson先容,Cortex-X2是完全面向智能手机市场的产品,预计在未来几代手机产品中就能看到Cortex-X2的身影。对智能手机和其他终端计算设备而言,64位将提供终极的性能表现。Arm目前正与中国应用商店生态合作伙伴进行密切协作,确保主要App都能在今年年底前支撑 64 位,从而为中国消费者提供Cortex-X2所带来的性能提升体验。

 

Arm方面产品专家透露,向64位过渡需要分阶段实现,目前,Cortex-X2、Cortex-A510已经是64位CPU,A710仍然支撑32位。预计到2023年,Arm在移动应用的大核跟小核都将仅支撑64位。


全面计算+生态合作高筑竞争壁垒

 

未来,在满足灵活多样的市场需求面前,IP设计始终面临挑战。特别是对一些复杂用例,毕竟更多的IP就意味着更大的优化挑战。Paul Williamson表示,Arm全面计算框架提供了跨多种应用的可扩展性,与此同时,也能够为具体的场景用例提供特定的加速或增强功能,这在真实的用例中非常有价值。在一致的开发框架和特定的加速功能下,全面计算解决方案既能针对应用场景构建优化的解决方案,同时也能平衡解决方案的性能和成本,这是下游设计真正需要的。

 

来自Arm的最新统计数据显示,2020年的最后一个季度,Arm 芯片合作伙伴共出货73 亿颗 Arm 架构芯片(年增 22%),创下出货量历史新高,相当于每秒出货超过 900 颗芯片、每日出货 7000 万颗芯片。Arm 的合作伙伴在 2020 年总出货量高达 250 亿颗 Arm 架构的芯片(年增 13%)累计总数已超过 1,900 亿。

 

此外,Arm 的 GPU 出货量累计超过80 亿,其中在2020年超过10亿,Arm Mali GPU持续位居全球GPU出货量榜首。

 

授权业务方面,2020 财年,Arm与 104 家客户签署了162个授权协议,其中有超过一半的授权对象为首次与 Arm 合作的企业。

 

除了授权业务,Arm联合合作伙伴所建立的IP、芯片、应用的一体化生态,也形成了其他对手暂时无法逾越的生态壁垒。Arm 生态系统近期的新客户包括 SEMIFIVE 与 Telechips。此外,Arm Flexible Access 目前已有 90 家合作伙伴,通过该计划,这些合作伙伴可以更容易地获取各项全球领先的 Arm IP、工具与支撑。

 

Paul Williamson 表示:“大家正致力于将Armv9技术引入各个领域,以系统级设计最大程度地提高性能。借助移动生态系统的规模优势,在笔记本电脑、台式机、云等应用领域打造领先的解决方案。”不止如此,Armv9 还希翼延伸到5G网络、数据中心、以及更多终端与车载架构计算。

 

这一势头正是Arm对全球数据实现用Arm技术进行处理的预期,不论是在终端、数据网络还是在云端,Arm希翼构建一个庞大、顺畅、无缝的计算实行网络。