ARM每年都该更新架构了。
昨晚,ARM推出了新的移动架构,即超大核Cortex-X2、大核Cortex-A710和小核Cortex-A510,取代了现有的X1、A78和A55。
终于更新了使用多年的A55小芯。同时,三种CPU架构均基于Armv9兼容设计,其中X2仅支持AArch64 64位指令,性能更上一层楼。
让我们先来看看X2皮层。官方表示,它是建立在相同的节点和相同的频率环境下,X2比X1内核实现了16%的速度提升。同时,X2的峰值性能得到优化,机器学习(ML)性能翻倍。
在前端,分支预测与预取单元解耦,因此可以在内核之前运行,从而减少预测误差,提高分支预测的准确性,提高大指令负载的性能。
在内核上,流水线长度从11个指令周期减少到10个,调度阶段从2个周期减少到1个周期。乱序执行窗口最多增加了30%,244个增加到最多288个。
在后端,加载存储窗口和结构增加了33%,这可以提高内存级并行性,一级缓存d-TLB也增加了20%,此外,数据预取能力也得到了增强。
综上所述,ARM宣称X2最大单线程性能比Intel i5-1135G7高40%。
然后是A710和A510,也是基于ARMv9 64位指令集,架构上与X2相连,所以可以集成到同一个SoC中。
不过需要注意的是,X2和A510都是64位,不再兼容32位,而A710是应国内客户要求专门设计的,继续支持OL0 AArch32。
A710还改进了分支预测,准确率更高,一级指令缓存TLB从32个增加到48个,但宏操作缓存仍然是1.5K(X2 3K)。
宏运算缓存和分支单元的宽度从6减少到5,这主要是功耗和能效的优化,也是X和A系列的重要区别。
所以Cortex-A710只比A78快10%(相同节点和频率),但能效提高30%,机器学习速度提高一倍。
最后,A510是最重要的升级。相比三年前的A55,功耗降低20%,机器学习能力提升3倍。根据ARM的说法,A510在性能上接近之前的A核。
也就是说,未来搭载A510 SoC的中低端机型会有相当大的性能提升。