苹果自主处理器历史

【CPU架构:没有革命 仍然惊喜】

两年多过去了,我们对A6、A7 CPU架构仍然知之甚少,苹果始终不肯公布任何技术细节。A8仍是如此,这一次甚至连架构代号都还不知道(以前两代分别是Swift、Cyclone)。

就目前所知,A8 CPU架构设计并没有像A6、A7上那样有着革命性的地方,也就是个增强版的Cyclone,但也并不算是坏事。A7架构已经十分优秀:较宽、较高的IPC设计,延迟很低,可以在很低的频率下取得很高的性能。(Intel酷睿的理念也与此类似)

A7的频率只有1.3GHz,A8也不过区区1.4GHz,但正因为如此,苹果无需在频率上投入太多,就能获得理想的性能,同时保证功耗足够低,这对移动设备来说显然是再理想不过的。

换句话说,苹果在去年就完成了其他芯片厂商明年才有可能做到的。

尽管不用再费力挖掘架构细节,但我们仍然想知道,A8究竟改变了什么。

根据估量,A8 CPU部分面积约12.2平方毫米,相比于A7 17.1平方毫米缩小了29%,也就是说在塞入了更多晶体管后,苹果凭借更新的工艺,反而减小了CPU所占面积。

从测试数据看,A8、A7 CPU的确是如出一辙,很多底层测试中都表现得就像同一颗芯片,只是浮点加法和整数乘法延迟更短了一些,缓冲和分支预测也可能略有不同。

A7只有1个整数乘法单元,需要4个周期执行,A8则只需3个周期,更神奇的是整数乘法性能翻了一番还多,这意味着现在有2个整数乘法单元了。

浮点加法也有很大提升,不过幅度没这么高,执行周期从5个缩短到4个,貌似仍是3个浮点ALU单元。

总体而言,A8、A7的变化有点像是Intel Tick-Tock的后一步,即升级工艺,架构上只是微调增强。

Series6XT是此前2012年诞生的Series6架构的增强版(G6430就属于后者),重点是通过架构上的各种调整和优化,提升性能、增加功能,比如支持下一代纹理压缩技术ASTC(自适应可扩展纹理压缩)。

该技术来自出品了OpenGL、OpenGL ES等标准规范的行业组织Khronos,可提供更好的纹理压缩性能、更精细的质量控制,同时也是所有GPU都可以支持的通用格式。

苹果一直都在用PowerVR GPU,一直支持PVRTC、PVRTC2,ATSC则可以进一步提升游戏画质和性能。

Series6XT架构还有新的电源管理技术,能降低待机、轻负载时的功耗,比如说“PowerGearing G6XT”门控技术可以单独开关每个GPU核心(着色器簇/USC),自然能够延长手机的待机时间。

Series6XT通过一系列底层优化,提升了总体性能,官方宣称最多可达50%,正好也是苹果宣传的数据,但具体怎么做的,Imagination并未公开。

我们只知道,新架构对核心(着色器簇)本身做了改进,仍然是16宽度的SIMD结构,但每条流水线都增加了一组中等/半精度FP16 ALU,也就是从2×3变成了2×4,理论上性能可提升33%。

FP16操作比FP32节省带宽和功耗,但是需要精心编程才能高效利用,否则性能提升会很有限。

FP32部分仍然是每条流水线两个ALU,每时钟周期最多四个FP32浮点操作,或者说128个MAD(乘加运算)。

为什么还是四核?

其实,Imagination已经有了更强大的六核心型号G6630、GX6650,完全可以更好地满足更大屏幕的iPhone 6、iPhone 6 Plus,而且有了新工艺的支持,晶体管、核心面积都可以更好地控制,为什么还是坚持四核心呢?

这再次体现了苹果的设计原则:绝不盲目追新,够用就好。

A8 CPU上只是一次进化,GPU也不必急着革命,尤其是G6430本来就已经很强大了,iPad Air 2048×1536的屏幕都不在话下,iPhone 6 Plus 1080p又算什么,GX6450本身的改进加上频率提升(如果有的话)确实正好。

A7 GPU部分的面积是22.1平方毫米,A8缩小到了19.1平方毫米。看起来很理想,但别忘了20nm理论上可以让它缩小11.1平方毫米的。这说明A8 GPU还是增强了很多的,尤其是那两块清晰可见的共享纹理单元,将对纹理性能产生至关重要的影响。

说到最后,对明年的A9更期待了:16nm工艺、CPU新架构、六核心GPU……

iPhone 6 A8处理器完全解密!完美苹果风