当下,AI已然成为科技行业的全新指向,AI智能手机以及AIPC大量涌现,为用户赋予了更为便捷且高效的使用感受。AI体验与设备性能紧密相连,今年AI终端的广泛普及,得益于设备性能的提升,而处于产业链最上游的Arm,为AI终端的性能升级筑牢了根基。
伴随AI技术的迅猛发展,为给予领先的AI体验,助力芯片合作伙伴更为轻松、迅速地构建基于Arm架构的解决方案,并加快其产品的上市步伐,Arm近期正式推出了崭新的Arm计算平台——Arm终端计算子系统(CSS)。Arm终端CSS不但拥有更为强劲的CPU与GPU,同时首次为Arm CPU和GPU交付物理实现,这使得构建和部署Arm架构的解决方案变得更为简易。
此前,Arm的多数IP通过RTL形式交付,类似软件,主要是对IP产品予以描述,后续需要借助EDA工具流,方能将RTL形式转化为实际的芯片布局。而Arm交付的物理实现虽说依然近似于软件形式,但基本呈现出了设计中的晶体管和线路等,如此能够协助合作伙伴节省时间,进而实现更优的性能和效率。
在2021年,Arm推出了专为性能和AI设计的Armv9构架,Armv9在过去的几年中获得了显著的提升,其中涵盖:提升在矢量加速、机器学习(ML)等领域的计算能力;强化系统的安全性和稳固性;更为关键的是,增添了面向AI的功能。
而Arm终端CSS将物理实现与Armv9的AI优势相互融合,为合作伙伴生态系统提供所需的性能,并加快其产品上市进程。Arm终端CSS整合了全新的Armv9 CPU和Immortalis GPU、新的CoreLink系统互连以及系统内存管理单元(SMMU),并对到内存及SoC其他部分的计算路径进行优化,为业界提供领先的性能。并且,这是Arm首次在终端领域以Arm CPU和GPU的优化设计形式提供物理实现解决方案。
Arm终端CSS提高了30%以上的计算和图形性能,以应对严苛的实际用例中的安卓工作负载,同时也将AI推理速度提升了59%,适用于更为广泛的AI/机器学习(ML)和计算视觉工作负载。
在CPU方面,此次推出了Arm Cortex-X925,该CPU针对三纳米工艺进行了优化,达成了性能和效率的提升,在3.8GHz的时钟速率以及2MB缓存大小的条件下,和2023年旗舰智能手机的四纳米SoC相比,Geekbench的单线程性能提高了36%。
在AI方面,凭借微架构的优势,实现了50%TOPS数的提升,以AI性能为例,和去年的Cortex-X CPU相比,词元(Token)首次响应时间缩短了41%,从而使LLM的初始响应能力得到了显著增强。
在体验方面,具备Cortex-X925的终端CSS进一步提高了安卓设备应用的性能体验,譬如在网页浏览器方面,能够带来23%的性能提升,除了Chrome,中国手机厂商也将这些提升应用到了自家的浏览器中。
同时,Arm还推出了Cortex-A725,和A720相比,Cortex-A725的能效提升了35%,这得益于Arm对微架构的改进。随着工艺和物理实现的进步,Arm的“小核”Cortex-A520的能效也提高了15%。
在GPU方面,Arm带来了性能更优、效率更高的Immortalis-G925,在各类图形应用上,Immortalis-G925的性能同比提升了37%;而在多个AI/ML网络上进行测量时,实现了约34%的性能提高。针对光线追踪技术,Immortalis-G925增强了光线追踪技术在面对复杂物体时的表现,其性能提升高达52%。
凭借全新CPU与GPU的性能与能效提升,在游戏方面的图形效率也有所提高,例如在提供与去年终端平台相同水平的游戏性能时,《堡垒之夜》等手游的功耗能够降低30%。
Immortalis-G925未来将面向旗舰智能手机市场,而包括Arm Mali-G725和Mali-G625 GPU在内的全新高可扩展性GPU系列,则面向从高端手机到智能手表和XR可穿戴设备等广泛的消费电子设备市场。
据悉,联发科将在今年下半年推出新一代天玑9400移动平台,该芯片会搭载Arm Cortex-X925 CPU和Arm Immortalis-G925 GPU。
针对开发者,Arm也推出了Arm Kleidi,其中包含面向AI工作负载的KleidiAI和面向计算机视觉应用的KleidiCV。KleidiAI是一套面向AI框架开发者的计算内核,使他们能够在各类设备上轻松获取Arm CPU上的卓越性能,并支持Neon、SVE2和SME2等关键Arm架构功能。KleidiAI与PyTorch、Tensorflow、MediaPipe等热门AI框架集成,旨在加快Meta Llama 3、Phi-3等关键模型的性能,并且还可前后兼容,以确保Arm在引入更多技术时依然能够适应未来市场的需求。