Arm发布新的终端子系统以提升AI性能和能效

访客 3C数码 1.1W+
Arm发布新的终端子系统,旨在提升AI性能和能效。

AI现已成为科技行业的新方向,AI智能手机和AIPC广泛出现,为用户带来了更加便捷高效的体验。AI体验与装备性能息息相关。今年AI终端的火爆,离不开设备性能的提升。Arm作为产业链的最上游,为AI终端的性能升级提供了基础。

 Arm发布新的终端子系统以提升AI性能和能效

随着AI技术的快速发展,为了提供领先的AI体验,帮助芯片合作伙伴更方便快捷地构建基于Arm架构的解决方案,加快产品上市进程,Arm正式推出了全新的Arm计算平台——Arm终端计算子系统(CSS)。Arm终端CSS不仅拥有更强大的CPU和GPU,还首次为Arm CPU和GPU提供了物理实现,使得Arm架构解决方案的构建和部署更加容易。

之前Arm的IP大部分是以RTL的形式交付的,类似于软件,主要描述IP产品。之后需要EDA工具流程将RTL形式转化为实际的芯片版图。Arm交付的物理实现仍然类似于软件的形式,但基本上展示了设计中的晶体管和电路,可以帮助合作伙伴节省时间,实现更好的性能和效率。

2021年,Arm推出了专为性能和AI设计的Armv9架构。Armv9在过去几年中有了显著的改进,包括:提高了向量加速、机器学习(ML)等领域的计算能力;增强系统的安全性和健壮性;更重要的是,增加了面向AI的功能。

Arm终端CSS结合了Armv9的物理实现和AI优势,为合作伙伴生态系统带来所需性能,加速其产品上市进程。Arm终端的CSS集成了全新的Armv9 CPU和Immortalis GPU,全新的CoreLink系统互联和系统内存管理单元(SMMU),优化了到内存和SoC其他部分的计算路径,为业界提供了领先的性能。而且这也是Arm首次以Arm CPU和GPU优化设计的形式,在终端领域提供物理解决方案。

Arm终端的CSS提高了30%以上的计算和图形性能,以应对实际使用案例中要求苛刻的Android工作负载,同时还提高了59%的AI推理速度,适用于更广泛的AI/机器学习(ML)和计算视觉工作负载。

 Arm发布新的终端子系统以提升AI性能和能效

CPU方面,这次推出的是Arm Cortex-X925。CPU针对三纳米工艺进行了优化,性能和效率都得到了提升。在3.8GHz时钟速率和2MB缓存大小的条件下,Geekbench的单线程性能比2023年旗舰智能手机的四纳米SoC提升了36%。

AI方面,得益于微架构的优势,top数量提升了50%。以AI性能为例,相比去年的Cortex-X CPU,Token的首次响应时间提升了41%,从而LLM的初始响应能力得到了显著提升。

 Arm发布新的终端子系统以提升AI性能和能效

体验方面,搭载Cortex-X925的终端CSS进一步提升了Android设备的性能体验。例如,在web浏览器方面,它可以带来23%的性能提升。除了Chrome,中国手机制造商也将这些改进应用到了自己的浏览器中。

 Arm发布新的终端子系统以提升AI性能和能效

同时Arm还带来了Cortex-A725。与A720相比,Cortex-A725的能效提升了35%,这得益于Arm对微架构的改进。随着工艺和物理实现的提升,Arm的“小核”Cortex-A520的能效也提升了15%。

GPU方面,Arm带来了性能更强、效率更高的Immortalis-G925。在各种图形应用中,Immortalis-G925的性能同比提升了37%。在多个AI/ML网络上测量时,性能提升了约34%。针对光线追踪技术,Immortalis-G925提高了光线追踪技术在面对复杂物体时的性能,性能提升高达52%。

随着新CPU和GPU的性能和能效提升,游戏的图形效率也得到了提升。比如《堡垒之夜》等手游,在提供与去年终端平台同等水平游戏性能的同时,功耗可以降低30%。

Immortalis-G925未来将面向旗舰智能手机市场,而包括Arm Mali-G725和Mali-G625 GPU在内的新的高扩展性GPU系列将面向广泛的消费电子市场,从高端手机到智能手表和XR可穿戴设备。

据悉,联发科将于今年下半年推出新一代天机9400移动平台,搭载Arm Cortex-X925 CPU和Arm Immortalis-G925 GPU。

 Arm发布新的终端子系统以提升AI性能和能效

对于开发者来说,Arm也带来了Arm Kleidi,包括面向AI工作负载的KleidiAI和面向计算机视觉应用的KleidiCV。KleidiAI是一套面向AI框架开发者的计算核心,使他们能够在各种设备上轻松获得Arm CPU上的出色性能,支持Neon、SVE2、SME2等关键Arm架构功能。KleidiAI集成了PyTorch、Tensorflow、MediaPipe等流行的AI框架,旨在加速Metalama 3、Phi-3等关键机型的性能,同时也是前后兼容的,以保证Arm在引入更多技术时仍然能够满足未来市场的需求。

标签: 性能 终端

抱歉,评论功能暂时关闭!