中国领先的电子元器件商城
您的位置:首页 -- 新闻动态 -- 产品动态 -- ARM与x86处理器功耗深度对比:Atom闲置功耗待优化
ARM与x86处理器功耗深度对比:Atom闲置功耗待优化
2013/3/15 11:48:14 浏览次数:1695

ARM与x86处理器功耗深度对比:Atom闲置功耗待优化

腾讯数码讯(编译:金鑫)以下是业界媒体AnandTech 发表的一篇文章,全文分为四个部分:第一,测试CPU和GPU功耗的方法以及Krait的特殊性;第二,Krait 、Atom 和Tegra 3功耗比较;第三,Cortex A15跟前面三者功耗比较;第四,英特尔可以在平板电脑领域获得长期成功的原因:把散热设计功耗(TDP)从8W降到4W的可行性很大。

上个月底,英特尔的一名功耗工程师前来拜访我时,向我演示了如何比较英特尔的Atom和NVIDIA的Tegra 3。这种演示难得一见。实际上,跟移动领域的大多数公司一样,英特尔也不仅仅靠测试设备级功耗来确定电池续航。为了确保自己的CPU、GPU、内存控制器,甚至是NAND都能达到尽可能低的功耗,大多数公司都会直接在平板电脑或智能手机的主板上测量功耗。

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

第一部分 测试CPU和GPU功耗的方法以及Krait的特殊性

如果主板上的测量点已经找好了,这个测试过程简直就是小菜一碟。但是在大多数情况下,英特尔(和它的竞争对手们)都会拆开一台从零售店买来的设备,用某种方式来测量CPU或GPU的功耗。我曾在一篇文章里描述过这个过程:

如果你对电池进行测量率,你可以了解整台设备的功耗(包括显示器、SoC、内存和主板上的其他一切)。要想知道设备充一次电可以坚持多长时间,这种方法倒是很有用。但如果你是一个组件供应商,你更关心的就会是竞争对手的组件的功耗。

下面的内容,可以说是艺术和科学的良好结合。英特尔的功耗工程师拆开了搭载竞争对手芯片的设备,探查任何看起来像是供电电路或滤波电路的东西,同时在设备上运行不同的负载。把负载和这些电路中的电压骤增联系起来,你就可以弄清智能手机或平板电脑主板上的哪些组件在给SoC上的哪个模块供电。尽管移动SoC如今的集成程度非常高,但芯片上的主要模块(比如CPU和GPU)一般都有自己的独立电压层。

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

(基本的LC滤波器)

通常,你会发现一个标准的LC滤波器(电感+电容)在给SoC上的某个模块供电。一旦你找到了正确的LC滤波器,你只需跟电感器串联一个非常小的电阻(2 - 20MΩ),然后测量电阻两端的电压降。由于知道电压和电阻值,你可以算出电流和功率。利用可靠的外部仪器(NI USB-6289),你也可以绘制出功率随着时间发生的变化,了解SoC中单独某个模块的功耗。

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

(改动后的LC滤波器,多了一个电阻)

我们在前一篇文章中描绘的那场芯片功耗对战略有些乏味:一方是搭载英特尔Atom Z2760(Clover Trail)的宏碁W510,另一方是搭载NVIDIA Tegra 3的Surface RT,结果当然是前者完胜。在我们的恳请下,英特尔又在测试中增加了两款平板电脑:搭载高通APQ8060A SoC(双核28nm工艺 Krait)的戴尔XPS 10,以及搭载三星Exynos 5 Dual (双核32nm工艺Cortex A15)的Nexus 10。结果,英特尔Atom 曾经轻而易举就能做的事情突然变得挑战性十足起来,因为本次新增的两个SoC都采用了非常新,功耗非常低的制造工艺,而且相对于Exynos 5,英特尔也不再具有性能方面的优势。

和上次测试一样,我把所有显示器都调校到我们平时测试的标准亮度:200尼特,并确保软件配置尽可能地相同。测试用的戴尔XPS 10和Nexus 10都是英特尔在零售店购买的,我又把它们的性能跟我们自己的样品和数据进行了对比验证,没有发现明显的偏差。因为我自己没有戴尔XPS 10,我就把它的性能跟三星 ATIV Tab(它跟戴尔XPS 10一样搭载了高通APQ8060A)作了比较,确保没有意料之外的因素干扰测试结果。

我们先从搭载高通APQ8060A 的戴尔XPS 10开始……

改动Krait 平台的电路:更复杂一些

跟改动宏碁W510和Surface RT的电路相比,改动戴尔XPS 10的难度更高一些。在宏碁W510和Surface RT上,从电池到SoC CPU模块的线路中都只有一个电感器。 XPS 10采用的是双核高通芯片。而高通自从开始设计多核心芯片以来,就给每个核心配备了独立的频率和电压层。虽然Tegra 3中所有的A9核心以及Z2760上的两个Atom核心,都在相同的频率和电压上运行,高通APQ8060A上每个Krait 核心却可以在各自的电压和频率上运行。结果就是:两个CPU核心需要两个供电电路。下图中用橙色标出的就是英特尔工程师找到的两个电感器:

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

(用橙色标出的两个电感器位于CPU供电电路上,黄色标出的较大电感器位于GPU供电电路上,工程师分别用20mΩ电阻对它们进行了改动)

工程师用20mΩ电阻分别对这两个电路进行了改动。然后测量20mΩ电阻两端的电压降,并实时计算CPU核心的功耗。下文图表中的功率指的都是两个CPU核心的总功率,除非另有说明。

可是,仅仅做这些还不能准确测量出高通CPU的功率。我们之前还写过一篇关于Krait 架构的文章(我们的文章很多),说高通把二级缓存放在一个单独的频率和电压层上了。在这样的情况下,虽说CPU核心频率最高可以达到1.5GHz,二级缓存最高只能达到1.3GHz。我在测试过了大半之后才想起这一点,而且我们也还没有找到Krait 的二级缓存的供电电路。因此,这里的高通CPU功耗数据不包含二级缓存的功耗。但整个设备的功耗数据却包含它,因为设备级功耗是在电池上测量的。

Krait :采用多电压层的原因

高通仍然执着于异步时钟和多电压层。我们对它的SoC进行了SunSpider测试,它可以把负载不均匀地分配给两个核心:

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

(绿色是CPU核心0,蓝色是CPU核心1)

SunSpider是一个很棒的基准测试,它向我们展示了为什么高通要给不同的核心配备不同的频率层。对于像这样的不均衡负载,第二个核心不是完全空闲的,但它也不是非常活跃。如果两个核心使用相同的频率和电压层,在这种情况下,第二个核心的漏电流就会更高。不过也有一种观点认为,如果你让第二个核心以最高频率运行,它就能更快地完成任务,然后就可以休息了,不会再消耗电能。而要做到这点,就需要有一个非常快的微控制器在 v/f模式之间转换。到底哪个方案能提供更好的省电效果,目前我们也不清楚。我们纯粹是在为找到了高通为每个核心配备单独电压层的佐证感到高兴而已。

但是另一方面,也有像Kraken这样的基准测试,把负载平衡地分配给两个核心,让两个核心都表现得相当活跃:

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

在这种情况下,有两个独立的频率和电压层没有什么好处,两个核心可以在相同的电压和频率上运行得很好。不过,高通也可以争辩说,遇到Kraken这样的情况很罕见(大部分用户体验仍然由单线程性能主导),因为可以在SunSpider那样的情况下省电,所以坚持异步时钟是值得的。这就是一个更大的哲学辩论了,需要大量图表作为佐证,我无意在本文中进行那么深入的探讨。

我个人觉得,高通会根据它目前的功耗管理架构,选择最好的解决方案,以实现最佳功耗水平。管理多个功率和频率层需要耗费更多的精力,如果高通没有看到这样做的好处,它也不愿意付出这些精力。话虽这么说,对于高通SoC来说最好的解决方案,对另一个架构未必就是最好。

第二部分 Krait 、Atom 和 Tegra 3功耗比较

Krait:闲置功耗

我们先来看看闲置状态的情况。虽然在你在实际使用设备时,电池续航是一个非常重要的指标,但有一个可以快速完成任务然后进入闲置状态的SoC,意味着你需要把闲置功耗降至非常低的水平,才能真正受益于电池续航指标。在这里,我们就用Windows RT 和Windows 8的“开始”屏幕来测试SoC的闲置功耗。你会发现基准测试中存在两个不同的阶段,后面一个阶段的功耗更低,因为活动磁贴进入了睡眠状态。在这个测试中,WiFi是开启的,但是没有进行任何后台同步。 为什么在活动磁贴进入梦乡之后我们还会看到峰值呢,就是因为开启了WiFi。

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

(绿色是Surface RT[Tegra 3], 蓝色是宏碁W510[英特尔Atom Z2760], 红色是戴尔XPS 10[ 高通APQ8060A])

宏碁W510的闲置功耗非常小。它愚蠢的WiFi设置导致了闲置状态下的峰值功耗,这跟戴尔XPS 10的情况差不多,不过W510的最低值明显低于其他设备。 Surface RT仍然是这三台设备中更耗电的。XPS 10的功耗处于Surface RT和宏碁W510之间。

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

如果我们只看CPU核心的功耗,情况就有所不同了。请记住,我们没有考虑二级缓存,所以图中XPS 10的表现比它的真正性能好一些,但Krait核心的最低CPU功耗看上去非常出色。我个人觉得,Atom Z2760采用的英特尔32nm工艺还是不如台积电的28nm LP功耗低,不过当英特尔22nm工艺处理器投产后,情况可能就会发生变化。在这里,所有相关的计算晶体管都应该采用了电源门控设计,我们看到的应该是所有SoC的最小漏电状况。Krait架构和28nm LP工艺的结合效果真是太棒了。我也不知道为什么Tegra 3在曲线的最末段会比其他两个都活跃得多。

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

在GPU方面,高通的Adreno 225的闲置功耗非常之低。虽然Atom Z2760上的PowerVR SGX 545图形处理器(图形处理器厂商Imagination 出品)曲线在末段看起来更加平坦,但是,高通的最小功耗比它更低一些。但我不清楚的是,这在多大程度上归功于构架,多大程度上归功于制造工艺。在GPU方面,即使系统处于闲置状态,显示屏仍然在刷新,因此会有一些活动发生,所以我们在这里看到的不是单纯的电源门控漏电功耗。

为了消除WiFi 控制器的影响,我把所有平板电脑都设置成飞行模式,重新运行了上面的测试。从图中可以看到,动态磁贴进入睡眠状态之后,功耗曲线的波动大大减少了。

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

现在宏碁W510的曲线看上去非常好。英特尔确实努力帮助宏碁尽可能地减小了功耗。 戴尔XPS 10比Surface RT的情况稍好一点儿,但也不是非常好。在这个部分,宏碁+英特尔组合的优势很明显。

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

只看CPU(不包括Krait 的二级缓存),高通APQ8060A的闲置功耗又一次低于Atom Z2760。我仍然觉得这主要得归功于台积电的28nm LP制程,而不是高通的架构。

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

SunSpider 0.9.1测试

在有负载的情况下,功耗测试的结果变得更加有趣了。我们还是从SunSpider测试开始看起,这是一个中等长度的JavaScript基准测试,我们经常在评测中使用它:

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

从设备级来看,搭载高通APQ8060的戴尔XPS 10处于Surface RT和宏碁W510之间。它的曲线跟搭载了英特尔系统芯片的W510看起来非常相似,但明显更慢一些,所以消耗的总电能也比较多。

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

单看CPU,情况则稍有不同。英特尔的峰值功耗跟Tegra 3相似,但Krait的峰值功耗明显更低。我觉得,由于没有算入二级缓存,高通的实际功耗应该比图中高出100 - 200mW,但整体来说,高通CPU的功耗仍然比较低。而且在后段的闲置状态下,Krait 似乎也具有优势。

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

但单看GPU的功耗,状况又有了变化,英特尔SoC上的Imagination GPU优势很明显。

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

Kraken测试

我们使用Mozilla 的Kraken基准测试的时间并不长,但它看上去非常厉害,测试时间远远长于SunSpider。Kraken测试的结果也差不多:

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

在设备级,宏碁W510的峰值功耗略高于戴尔XPS 10,但它完成测试的速度也更快,因此整体能效更好。

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

单看CPU核心,高通再次保持了领先优势,不过我再次觉得这个胜利被夸大了,因为我们并没有考虑高通的二级缓存功耗。英特尔的性能确实更好,因为它让CPU更早进入梦乡。

至于Tegra 3,它的表现毫不出人意料。

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

RIABench测试

跟漫长的Kraken测试不同,RIABench Focus Tests 只需几秒钟就可以完成,我们可以从图中看到更精细的状况:

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

在设备级,W510的功耗更高,但相对于XPS 10,W510在闲置状态下的功耗更低。Surface RT的功耗比它们两个都高。

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

Krait (不含二级高速缓存)的CPU功耗再次低于Atom,但Atom完成任务更快。在这种情况下,总能效较佳的仍然是高通。事实上,CPU级结果和设备级结果之间的差异,部分是因为高通的CPU曲线中缺乏二级缓存的功耗数据,部分原因在于平板电脑本身。

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

Krait :WebXPRT 2013——社区预览版1

我也使用Principled Technologies新开发的HTML5/js Web测试套件WebXPRT进行测试。在这些测试中,英特尔和高通的表现仍然相当接近。由于高通和英特尔的测试不是同时运行的,测试图没有完全校准,因此从图中看起来,好像英特尔花了更长的时间才完成测试,但现实情况恰好相反。这些测试的结果是:在设备级,W510优于XPS 10;但在CPU级,Krait优于Atom;单看GPU,Imagination 优于Adreno 225。由于3D性能在这里没有多大意义,Adreno 225的3D性能优势没有体现出来 —— 它只是消耗了更多的电能。

Tegra 3跟Atom和Krait 没有可比性,它们不在同一个级别上,不过我们期待看到Tegra 4的表现。

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

TouchXPRT 2013测试

我们还使用了PT公司的TouchXPRT 2013。这是一款Windows基准测试工具,是PT在英特尔的帮助下开发的,但它并未对英特尔处理器进行优化,而完全是靠图像和视频处理这样的重负载进行测试。由于TouchXPRT 2013没有“同时运行所有测试”的功能,所以我们分开展示它的每一项基准测试结果。在之前的测试中,高通一直比英特尔慢,而这里的多项TouchXPRT测试显示它们的性能非常相似,因此我们可以看到,在性能相当时,高通和英特尔的功耗有什么差异。TouchXPRT 2013的测试结果跟之前的结果大同小异:在大多数情况下,宏碁和英特尔似乎都是设备级和GPU方面的赢家,而高通是CPU级别的赢家。我仍然不清楚这有多少归功于高通CPU核心的功耗优势,因为我们没有把二级缓存算进来。

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

GPU功耗 ——3D游戏负载测试

之前的测试主要是考察设备级和CPU级功耗,现在我们来重点了解一下GPU的功耗。我们尚未拿到在Windows RT和Windows 8下统一测试图形性能的工具,不过下面的图表显示了通过大致相同的路径运行同一款DX游戏时的功耗。Tegra 3仍然是这个测试中速度最快的,之后是Adreno 225,垫底的则是PowerVR SGX 545。功耗的排序大致也相同,但Tegra 3在达到那样的图形性能时,功耗比另外两个GPU远远高得多。我倒是很想看看性能更强的Imagination GPU会有怎样的表现。

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

第三部分:测试ARM的Cortex A15

Atom跟高通APQ8060A之间的比较,让我们更好地了解了Atom在当今世界中的地位。就像英特尔一样,高通似乎也优先考虑单线程性能,并采用了领先的LP工艺制造SoC。如果现在是2012年上半年月,我们这篇文章已写完了。但现在是新的一年了,一个新的竞争对手已经现身:ARM的Cortex A15。

我们已经见识过Cortex A15的惊人性能。虽然英特尔已有5年历史的Atom核心仍然可以战胜市场上大多数其它ARM芯片,Cortex A15却轻易地胜过了它。但Cortex A15在功耗方面又如何呢?

为了找到答案,我们测试了谷歌Nexus 10搭载的三星Exynos 5250系统级芯片。 5250(又名 Exynos 5 Dual)集成了两个ARM CortexA15 核心,主频可达1.7GHz,此外还有一个ARM Mali-T604 GPU。测试方法与前面相同。

闲置功耗

Exynos 5250的操作系统不是Windows RT,所以我们没有必要等着动态磁帖消停下来。 Android主屏画面一开始就是静态的,这时的功耗波动跟WiFi关系更大:

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

(绿色是Surface RT[Tegra 3], 蓝色是宏碁W510[英特尔Atom Z2760], 红色是戴尔XPS 10[ 高通APQ8060A], 紫色是谷歌Nexus 10[三星Exynos 5250])

在闲置状态下,Nexus 10的设备级功耗比其他任何平板电脑都高。这应该不会太令大家惊讶,因为它的显示屏需要更多功率,我们不能据此推断出它的SoC状况。下面,让我们来看看5250的CPU和GPU模块的闲置功耗吧:

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

呵呵,这就是电源门控的奇妙世界。尽管某些CPU核心的功耗比其他核心高得多,但是当大家什么都不做的时候,ARM Cortex A15 看上去跟Atom 甚至Krait也没有什么不同。

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

单看GPU,Mali-T604的成绩最出色。显示屏上几乎没有任何活动,GPU也没有什么工作要做,我觉得这里也显示了三星32nm LP(HK + MG)工艺带来的优势。

采用飞行模式(关掉WiFi后)后,情况还是差不多。Nexus 10整个设备的功耗比较高,因为它的显示屏很耗电,但在SoC级别,它的闲置功耗就很好;GPU的闲置功耗仍然低得惊人。

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

Cortex A15的SunSpider 测试

在Nexus 10的Chrome上进行SunSpider测试时,Exynos 5250的曲线比竞争对手波动大。我不会太在意这个设备级的图表,因为它跟Chrome 的优化很有关系,但是我们已经可以看到Cortex A15在功耗方面的倾向了。

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

虽然这些线条看上去很漂亮,但你难理解这到底是怎么个情况。所以从现在开始,我给每个曲线图都配上一个条形图,它们使用测试运行期间的数据(不包括闲置状态),显示了总的电能消耗量(单位焦耳),除非另有说明,条形越短越好。

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

这个条形图的数据跟上面的曲线图吻合得非常好。从测试过程中消耗的总电能来看,宏碁+英特尔优于戴尔+高通。 Nexus 10的表现很糟糕,但这可能主要是软件问题造成的。

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

只看CPU,Exynos 5250 就像是嗑了药。它的峰值功耗达到了3W左右,而竞争对手们还在1W附近徘徊。

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

高通CPU核心位居第一,可是不要忘记,我们没有计入Krait核心的二级缓存功耗(我们计入了Atom的二级缓存功耗)。其实Atom和 Krait的结果是非常接近的。

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

即使只看GPU,它的功耗也比其他两个都高(请自动无视Tegra 3)。

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

SunSpider - 平均、最大、最小功耗

下面这些图供你参考,它们显示了在整个测试过程中(不包括开始/结束时的空置时间)最大、平均和最小功耗。

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

平均功耗

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

最低功耗

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

Cortex A15:Kraken测试

在SunSpider测试中,Exynos 5250的表现堪忧,但在Kraken测试中就完全不同了。Cortex A15核心完成的任务的速度明显比竞争对手更快,因此,虽然它的峰值功率非常高,但总的功耗却很不错。

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

尽管有如此之高的峰值功耗,Nexus 10和Cortex A15核心的总能耗却是最低的,这是因为Exynos 5250可以迅速地完成基准测试,然后就开始休息。排在它之后的是英特尔,然后是高通。

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

再一次,我们看到了Cortex A15在3W左右的CPU峰值功耗,竞争对手的峰值功耗则小于1.5W。虽说性能上的优势足以抵消高功耗的不足,但是在设备的散热方面(比如智能手机),我不知道会发生什么事。

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

但看CPU,它们的数据很接近,这次是高通领先了。

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

在差不多闲置的状态下,三星32nm LP(HK + MG)工艺制造的Mali-T604功耗非常低。

Kraken —— 最大、平均、最小功耗

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

平均功耗

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

最小功耗

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

Cortex A15:RIABench测试

RIABench测试结果跟其他测试大同小异。在RIABench测试中,Cortex A15虽然峰值功耗略低,但跟Atom 和 Krait之间的差距仍然很大。实现性能上的飞跃确实要在功耗方面付出相当大的代价。

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

RIABench ——最大、平均、最小功耗

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

平均功耗

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

最小功耗

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

Cortex A15:WebXPRT 2013 ——社区预览版1

显然,由于我们没有针对Android版本的TouchXPRT,我们不能运行那个测试。但在这里,我们可以使用PT的WebXPRT的测试。Exynos 5250的成绩是我们迄今为止看到最好的(246)。由于我们使用了不同的浏览器,它可能还没有发挥出性能的最佳水平。Exynos 5250以9%左右的优势领先于Atom ,但它的功耗也很高。

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

这个双核Cortex A15芯片的峰值功耗还是接近于4W。英特尔和高通都小于1.5W。

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

WebXPRT 2013 CP1—— 最大、平均、最小功耗

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

平均功耗

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

最小功耗

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

Cortex A15:GPU功耗 ——3D游戏负载测试

ARM的Mali-T604 GPU速度相当快,但跟ARM的Cortex A15 CPU一样,它要提供那样的性能也非常耗电。GPU峰值功耗略低于4W,跟高通的Adreno 225(1W)没法比。在这个测试中,甚至是Cortex A15 CPU也消耗了比其他CPU更多的功率。看起来,Exynos 5250的典型TDP(散热设计功耗)就是4W了,这是Atom Z2760和高通APQ8060A的TDP的1到4倍。

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

Mali-T604为图形性能优势付出了代价:它电能耗用总量总是远远高于竞争对手。

GPU的功耗 ——最大、平均、最小功耗

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

平均功耗

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

最小功耗

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

第四部分:英特尔可以在平板电脑领域获得长期成功的原因

确定Exynos 5 Dual的散热设计功耗

纵观前面的Cortex A15测试,不管是CPU还是GPU,都不停地撞到4W这个功耗天花板上—— 但我们很少看见CPU和GPU同时达到这么大的功耗。英特尔的工程师给我出了一个鬼点子,让我迫使Cortex A15的CPU和GPU都以最高性能运行,看看会发生什么状况。所以我做了下面这个测试。下图分为五个不同的区域,由彩色横条表示;绿色曲线表示GPU的功耗,蓝色曲线表示CPU的功耗,红色曲线表示整台设备的功耗(其中也包括显示器,这个值是在电池上测得的)。

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

在第一个部分(黄色横条),我们开始玩《现代战争3:堕落国度》,这是一个图形密集型第一人称射击游戏。 GPU的功耗略低于4W,而CPU功耗仍然低于1W。约玩了一分钟之后,我们停掉这个游戏,这时你可以看到CPU和GPU的功耗都大幅下挫了。在接下来的部分(橙色横条),我们启动了CoreMark(一个小型的CPU基准测试)的多线程负载,让它反复循环。 结果CPU的功耗冲上了4W峰值,而GPU的功耗则非常低。

接下来,在继续运行CoreMark的同时,我们开始玩《现代战争3》(粉红色横条)。GPU曲线立刻上扬,达到4W左右,请注意这时CPU的功耗:曲线下滑到了低得多的后台任务频率(800MHz到1.7GHz)。当整个SoC 的总功耗窜到4W以上时,控制器就快速做出反应,通过降低CPU的电压和频率,把功耗维持在4W左右。 为了确认CoreMark仍在运行,我们又切换回到这个测试上(蓝色横条),这时CPU曲线上去了,GPU曲线又下来了。最后,我们切换回到《现代战争3》,CPU + GPU的功耗在非常短的时间内冲到8W左右,然后CPU曲线就又下来了。

当然,很少有人会在现实生活中这样使用设备,但用它来了解Exynos 5250的做法是很有必要的。 Exynos 5250的功耗可以达到8W,从传统定义上说,它的TDP就应该是8W,但Exynos 5250似乎努力把典型负载功耗保持在4W左右。

为什么我要强调8W和4W这两个数字呢?

英特尔已经展示了推出8W TDP型号Haswell 的兴趣和能力。实际上,要让芯片适用于Nexus10 这样的设备,英特尔要把 TDP做到4W。看到Exynos 5250的做法,把TDP从8W降到4W 的可行性似乎大大提高了。当CPU和GPU模块都在满载状态时,三星通过限制CPU来保持4W的功耗水平,那么8W的Haswell遇到这种情况又会怎么做呢?对此我深感好奇。

结语

做了这么多的测试,结论已经一目了然,但这里我还要多谈一些内容。我们已经知道,Atom的速度比Krait快,但是从功耗的角度来看,这两个SoC 相差不大。英特尔的设备级(至少在宏碁W510上)功耗更具优势,但这种优势可能是来自于W510自身,比如它的显示屏更节能等等,并不一定就说明英特尔Atom 优于高通Krait。

如果只看CPU核心,高通就领先于英特尔了。这一点还不能最终确定,因为我们没有计入高通的二级缓存功耗,但英特尔的二级缓存功耗是计算在内的。我个人觉得,就算计入了二级缓存功耗,高通还是可以领先于英特尔。

在GPU方面,虽然Adreno 225拥有性能上的优势,但它的功耗却比PowerVR SGX 545高。对于 modern UI性能来说,PowerVR SGX 545已经足够用了,但Adreno 225确实有更快的3D 性能。英特尔在GPU功耗方面的优势来源于采用了低性能的GPU,但是在2D modern UI测试中,Adreno 225的性能优势无法体现,因此输给英特尔也不算太冤枉。

高通的闲置功耗更低,这表明英特尔的32nm SoC工艺尚需改进。台积电的28nm LP和三星的32nm LP工艺都能帮助芯片实现低得出奇的闲置功耗水平。话虽这么说,但Atom 架构已经有5年历史,它的制造工艺也有3年历史了,还能达到这样的功耗水平,也确实令我感到吃惊。9 到12个月后,我们会见到英特尔用22nm低功耗SoC工艺制造的Atom核心。它的性能和功耗将有何种改善,我们将拭目以待。

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

(智能手机设备级功耗曲线)

本文要强调的是,英特尔的低功耗SoC设计正在朝着正确的方向前进。从上图中看, Atom的功耗曲线跟高通的很相似,我觉得也跟苹果的也很相似。性能和功耗之间需要把握平衡,但三家公司的做出的权衡取舍大同小异,所以说这个方向是正确的。

Cortex A15的数据是最有趣的。我不知道A15 架构的智能手机SoC和Cortex A15在功耗上存在怎样的不同,但至少从这里的数据看,Cortex A15在功耗方面真的是相当高。在执行某些任务时,这可能不是一个问题,但你还是需要机箱有非常好的散热能力,达到当前高通和英特尔智能手机SoC TDP的1 到 4倍。对于平板电脑来说,Cortex A15的效果非常好,但我很好奇,这样的芯片装在智能手机上会怎样。在进行一些调整后,它也许可以提供合理的电池续航,但直接把Nexus10上的Exynos 5 Dual放到一个手机中可能行不通。我觉得,这就是为什么ARM提出big.LITTLE概念,以及苹果为什么设计Swift的一个明显原因。

转播到腾讯微博
The ARM vs x86 Wars Have Begun: In-Depth Power Analysis of Atom, Krait
& Cortex A15

我一直听到有人说Haswell是ARM问题的解决方案,特别是对于Cortex A15的问题。前面的测试数据让我明白了这究竟是什么意思。当一个CPU或GPU承担重负载时,Exynos 5 Dual 可以保持功耗在4W左右,但它的TDP峰值却接近8W。英特尔曾说过,8W是Haswell的一个潜在设计目标。实际上,我觉得Haswell的功耗甚至低于8W。虽然现在说Haswell可以把功耗保持在4W早了一点,但我觉得,英特尔显然认为在不久的未来4W是可以实现的。也许在22nm工艺下还不行,但到14nm时就肯定可以。我们已经知道, 22nm工艺的Core可以把功耗降到8W以下,如果它真的能保持在大约4W,就可以为传统的高端架构开辟一个全新的类型。

我的看法就是这样。英特尔的Core架构可能会主攻4W以上的空间,Atom则会服务4W以下的领域。试想一下,在14nm工艺到来时,最迟在10nm实现时(2017年),我们的智能手机就可以搭载Core核心的SoC了,这个想法很大胆,但不算太荒唐。我们经常说,智能手机是未来的主流计算设备,而这就是我们通向那个未来的路径。当英特尔开始推出10nm的超便携 SoC时,你的智能手机就能具备Sandy Bridge或Ivy Bridge架构那样的性能。

我认为,英特尔在平板电脑领域获得长期成功的可能性非常之大 ——至少是在架构方面是如此。英特尔仍然需要一款像Nexus、iPad这样重要的设备来开路,但到2014年,它应该已经做好了技术方面的准备。如何在商业方面进行保驾护航,那得由英特尔的CEO来决定。

至于智能手机,这个问题就复杂多了。英特尔需要制定良好的高端基带战略,就算是收购了英飞凌,这件事它也没能办到。而在这个领域,高通是无可争议的王者,英特尔还有很长的路要走。至于智能手机SoC的其他方面,英特尔已经步入正轨。其现有的架构,在性能和功耗方面都能跟高通的最佳产品一争高下。英特尔和高通都计划在不久的将来更新架构,所以我们可以看看这场大战究竟将如何发展。如果说ARM是新的AMD, 那么Krait就是新的Athlon 64,不同的是,这一次英特尔不会推出奔腾4了。

来源:anandtech

 

公司介绍 - 特别声明 - 隐私政策 - 导购指南 - 人才招聘 - 联系我们
版权所有 © 2024 深圳市浩光利电子有限公司 备案号:粤ICP备19120514号-1 粤ICP备1821231456号