苹果A13 Bionic究竟有多强?
自从第一个由苹果设计的智能手机芯片(2010年的A4)问世以来,该公司一直是移动芯片设计领域不可忽视的力量。几年之后,当苹果使用自己的CPU设计而不是授权的架构时,A6的性能领先才真正开始提升。
在过去的几年中,Apple的CPU确实另对手难以望其项背。A11 Bionic不仅具有定制的Apple设计的CPU,并且还放弃了基于PowerVR的图形处理器为其自己的定制GPU。此外,它还引入了神经引擎,这是一种与CPU和GPU分离的芯片定制块,专注于加速机器学习计算。
从那时起,苹果的移动芯片就在智能手机芯片领域占据主导地位。也许iPhone并没有业内最快的手机网速,但苹果可以确保没有人能拥有更快的CPU、GPU或机器学习加速能力。
已有一年历史的A12 Bionic在许多方面仍比任何Android手机中的芯片都要快,而在iPhone 11和iPhone 11 Pro上首次亮相的A13芯片则要快得多。以下是让A13 bionic再次在智能手机竞争中胜出的原因。
高新技术7nm+的过程
苹果总是使用从其代工伙伴(几乎一直是台积电)那里获得的最好的制造工艺技术。如今,这意味着它是首批使用台积电新一代7纳米工艺的公司之一。它类似于去年的A12仿生处理器和AMD的Ryzen 3000系列处理器的7nm制程。
第二代工艺,有时被称为7nm+或7NP,用极紫外光刻(EUV)蚀刻一些芯片层。这意味着体积更小、封装更紧密的晶体管泄漏的功率更少。
台积电的第二代7nm工艺采用部分EUV技术,制造出更快、更省电的晶体管。
在实践中,这意味着在相同的空间中有更多的晶体管,但是在相同的功耗下有更高的时钟速度,或者在相同的时钟速度下有更少的功率。这正是我们在A13 Bionic上看到的。
苹果在A13中塞进了85亿个晶体管,比A12增加了23%。据估计,该芯片比A12的83mm²大了大约20%,约98mm²。因此,苹果在密度上仅实现了很小的提高,但是在最大性能和功率效率方面却实现了大幅提高。
不过,这不是苹果有史以来最大的芯片。新款iPad Pro中的A12X具有更多的晶体管(100亿个),估计约为135mm²,A5和A10 Fusion都超过120mm²。
最快的CPU会变得更快
苹果定制的CPU设计通常比任何竞争对手的智能手机芯片都能提供更快的单核性能,尽管当你在谈论完全不同的平台时,很难依赖基准测试。多核性能也很难被超越。
A13 Bionic延续了这一传统。苹果表示,其两个大型高性能CPU内核和四个节能CPU内核均比A12快20%。
CPU性能是最好的。没有Android手机接近这些数字。
在现实世界中,您几乎从未实际看到理论上的最大性能提升,但是我们的基准测试显示CPU性能提升了大约20%,多核性能甚至更高。
与去年同期相比,这是一个了不起的提高,对于高通,三星等公司来说,要与之匹敌是一个很大的挑战。
在GPU性能上迎头赶上
如果说有一个领域是竞争对手的智能手机处理器能够击败苹果,那就是图形处理性能。苹果的GPU在现实世界的表现是业内最好的,但一些跨平台的基准将有利于最新的Android手机。
A13的GPU仍然是苹果自定义的四核设计,苹果称这是“金属优化”(metal optimized),速度快20%。在我们的测试中,它要快得多。使用GPU上的Metal API的Geekbench的计算性能在Geekbench 4和Geekbench 5中都快了40%。
去年,高端3D Mark 5冲击测试没有太大改善,但在A13上有了很大进步。
我们进行的3DMark Fire Strike测试速度提高了50%到60%(这是现代高端3D游戏性能的良好衡量标准)。较早的3DMark Ice Storm Unlimited的运行速度快了近30%。在这次测试中,苹果公司的芯片已经远远超过了竞争对手,而这只是比分的上升。
旧的“Ice Storm”测试没有“Fire Strike”测试改进的多,但它已经比其他智能手机芯片快得多。
如果将GPU计算性能和游戏级3D基准结合起来,可以说苹果目前是智能手机中最快的整体GPU。不过,与CPU性能相比,这是一个更接近的预测,而且在2020年秋季推出A14之前,更容易看到竞争对手抢走桂冠。
有趣的是,我们看到现实世界的性能远远超过了苹果提出的20%的改进要求。很难知道是什么原因造成的,但我认为与内存峰值理论性能相比,内存带宽需要做的更多。
苹果声称A12的GPU性能比A11快50%,但我们没有看到任何类似的改进,一些测试根本没有显示出任何真正的改进。当时我们猜测,内存带宽的限制使芯片无法在一些3D图形测试中获得最佳的理论性能。也许在今年,尽管芯片的速度没有达到50%,但它能够更好地利用可用的内存带宽。
不管是什么原因,苹果公司在GPU性能上实现的改进远远超过了之前承诺的20%。
更高的能效
苹果公司表示,A13的GPU和高效CPU内核的功耗降低了40%,而高性能CPU内核的功耗降低了30%,神经引擎的功耗降低了15%。
然而,这些数字都有一个大大的星号。这是在提供与A12Bionic相同性能时的节能效果。换句话说,当A13的部件以与A12相同的速度运行时,它们消耗的能量要少得多。当它们运行得更快时,节省的功率就会大大减少。
在基准测试中,iPhone 11的电池寿命大约等于iPhone XR(尽管要快得多)。在实际的日常使用中,我们发现其使用寿命更长。
苹果公司表示,这部分是通过设置数百个电压域来降低芯片主要部件不使用时的功耗,以及设置数十万个时钟门控域来禁用不使用的逻辑门来实现的。这听起来令人印象深刻,但老实说,这是现代顶级芯片设计的一个相当标准的部分。也许苹果在这些设计元素上比竞争产品走得更远,没有精确的数字是不可能知道的,但这不应该被视为一种特殊的新创新。
电压和时钟域可确保在这一精确的微秒内未使用的芯片部分不会浪费任何电能。
抛开这些警告不谈,A13每瓦的性能比A12有了惊人的飞跃。尽管具有相似大小的电池,相同的显示屏并提供了更高的性能,但在我们的Geekbench 4恒定基准电池测试中,iPhone 11的使用寿命与iPhone XR一样长。在日常使用中,电池使用寿命更长,这也许是所有电池中最好的指标。iPhone 11 Pro的续航时间比iPhone XS长很多,但这不仅仅是因为A13芯片更高效,它的显示屏也更高效,电池也更大。
要对不同手机上的芯片进行真正的“苹果对苹果”(apple -to-apple)能效比较,很难消除所有必要的变量。但关于A13 Bionic的能效,人们可能会说最糟糕的事情是,它在使用与A12相当的功率时,似乎提供了更好的性能。
专为机器学习而设计
今年,CPU有了一个新花样:一组“机器学习加速器”,它执行矩阵乘法运算的速度比单独使用CPU的速度快六倍。目前还不清楚这个硬件是如何访问的(它们是ARMv8指令集的扩展吗,就像Intel的AVX是x86的扩展一样?),但是对于像机器学习(ML)这样需要大量矩阵操作的任务来说,CPU是强大的。注意,这个矩阵乘法硬件是CPU核心的一部分,与神经引擎硬件分离。
在一种非常特殊的数学运算过程中,CPU的速度提高了6倍。
与芯片中的其他所有功能一样,神经引擎的运行速度比以前快了20%(就好像设计相对不变,新的7nm +工艺使时钟速度提高了20%)。
苹果称其为“金属优化”的GPU可能是新设计,也可能不是新设计,但在我们的测试中,它使用Metal API提供更快的计算性能。
芯片中有一个机器学习控制器,可以自动调度CPU、GPU和神经引擎之间的机器学习操作,这样开发者就不必自己去平衡负载了。
CPU、GPU和神经引擎一起执行机器学习任务
因此,机器学习代码在A13上的运行速度应该比在A12上快得多。
标准已经设定好了
在新款iphone和A13仿生芯片发布的几个月前,我们做了一系列预测。
制造工艺猜对了,而且尺寸相当接近(我们估计超过100mm²),但是我们高估了7nm+工艺的密度增加,并认为苹果将生产100亿晶体管处理器,而不是85亿。我们还假设单核和多核性能稍好一些,但是低估了GPU的性能。我们还认为神经引擎将大大扩展。相反,它只比芯片的其余部分快20%,而Apple在CPU中内置了专用的矩阵乘法硬件。
对我们来说,对A14做出一系列预测还为时过早,只是说我们希望它使用台积电最先进的工艺,甚至更快,更节能。但是对于A13 Bionic,它再次为智能手机SoC设定了标准。也许有一种特定的指标可以使竞争性芯片更快,但是没有人能够接近CPU,GPU和机器学习性能的交集,更不用说苹果公司在其中最好的所有专用功能(如图像)信号处理和视频编码)。