MCPLive > 杂志文章 > AMD PUMA+低功耗APU技术与性能分析

AMD PUMA+低功耗APU技术与性能分析

2014-07-31张平《微型计算机》2014年7月上

从CPU架构来说,Beema或Mullins所使用的Puma+架构和之前的Jaguar是一样的,它依旧是一个双发射的乱序执行架构,内存位宽也维持为64bit。不过AMD宣称Beema和Mullins受益于新工艺,在1.2V电压下核心漏电比前代产品降低了19%,GPU部分的漏电电流量低了38%,这也是Beema和Mullins拥有更低的电压和更高能耗比的主要原因。
不仅如此,AMD还调整了Beema和Mullins的内存接口。这一代产品使用的是DDR3L这种低电压的产品,而上一代产品则使用的是DDR3。相比DDR3L来说,DDR3由于要兼容各种类型不同的内存模块,因此设计更为复杂。AMD从移动SOC那里得到了设计灵感,使用了较为专用的DDR3L内存界面,这样的改进使得运行在低功耗状态时,内存的功耗降低了500mW。不过,虽然目前的Beema APU已经基本完成了SOC化,但是考虑到其定位并非手机这样空间狭小的地方,因此AMD并没有考虑将内存芯片和APU芯片采用堆叠封装以减少面积,依旧使用了传统的分离式架构。

从测试数据来看,在电子书阅读、网页浏览、高清播放以及MobileMark 2012的测试中,Beema都展示出了相对于Kabini更为出色的功耗表现,平均降低了约20%。此外,从AMD历年来的产品来看,2008年AMD推出的代号为“Tigris”的Turion处理器的待机功耗高达3.5W~4W,随后代号为“Danube”的处理器将待机功耗降低到了3W左右。近一次显著的变化是第一代代号为“Llano”的APU中,待机功耗大幅度降低到了2W左右,新的代号为“Kaveri”的APU的待机功耗已经来到了1.5W附近。在超低功耗处理器方面,第一代超低功耗处理器代号为“Brazos”的产品待机功耗甚至高达2W以上,而新的Beema和Mullins待机功耗降低到了0.5W左右,着实令人惊讶。

为了达到这样的成果,AMD使用大约30项技术:包括各种功耗门控技术、各种频率控制技术、电压控制技术、显示控制技术等,甚至一些接口诸如PCI-E、DisplayPort的接口功耗控制都被纳入其中。AMD总结自己使用了四个方面的技术,包括智能动态功耗管理、进一步整合系统元器件、电路功耗优化、生产工艺升级改进。这四个方面的技术配合一些特色设计一起努力,终实现了AMD目前在移动处理器上的低功耗表现。同时AMD还给出了有关电子书阅读模式下的功耗情况,AMD新的Mullins APU在电子书阅读状态下相比上一代产品功耗降低了大约20%~25%,不过依旧无法和目前比较主流的ARM架构移动SOC芯片相提并论。不过AMD目前也不打算染指安卓设备,这一点也是完全可以容忍的。

更高的频率提升空间

一般来说,同时降低功耗并提升频率是几乎不能完成的事情。不过在Beema和Mullins上,AMD在降低了功耗的同时还提升了频率。出现这样的情况,主要原因是AMD使用了更为出色的频率控制技术,并且调整了温度控制的阙值。首先请让我们来看看表2的数据,表中展示的是AMD新的Mullins对比上一代产品Temash在高频率和TDP功耗方面的对比情况。可以看到,A10 Micro-6700T的TDP功耗为4.5W,高频率为2.2GHz;相对应的上一代Temash架构的A6-1450 TDP功耗为8W,高频率仅为1.4GHz。此外,其他两款Mullins APU产品也分别提升了60%和40%的高频率。而在表3中,我们则对比了Beema与Kabini CPU核心的不同,其中除了E2-6110对比E2-3000这一组产品略有降低外,其余产品的CPU核心都获得了明显的频率增加,并降低了TDP。

除了CPU部分的频率可以提升外,Beema与Mullins的GPU部分频率也获得了明显提升。如表4与表5所示。那么,AMD是怎么做到在生产工艺没有革命性改变的时候,降低功耗并提高频率的呢?原来AMD设计了一个名为STAPM的技术,Skin Temperature Aware Power Management即表面温度感应功耗管理。简单来说,这个技术的本质实际上还是通过提高芯片允许温度上限来实现更高的频率—这和英特尔在Bay Trail上做的事情差不多。

同时,平板电脑本身是拥有一定散热能力的,为了衡量并更好地使用这个能力,AMD还设计了一个称之为TSP功耗的值。这个值是通过在安装了四核心Mullins APU的11.6英寸平板电脑上运行3DMARK 06时,设备表面温度升高至用户可以接受的极限状态来确定的。对一个4.5W TDP的Mullins处理器来说,TSP瓦数为3.5W。换句话来说,TSP就是设备能够容忍的热量极限,在实际运行中,虽然芯片在不停地散发热量,但是设备拥有一定的热存储和热迟滞的能力,使得即使芯片温度达到比较高的程度,但设备依旧处于安全、舒适的温度范围内。

而上一代AMD低功耗产品仅仅控制芯片温度,只要芯片温度超过60℃,那么立刻会进入降频状态,无论CPU还是GPU都是这样。但是设备温度的上升速度总是远远落后于芯片温度,并且设备温度的上升过程是缓慢的,甚至在芯片满载状态下数分钟之内都不会导致设备过热。所以,AMD新的STAPM设计更为优秀:只要设备的温度控制在一定的范围内(用户不会感觉到设备温度太高),同时提高芯片温度上限,那么芯片就可以更长时间运行在更高的频率上。

新的Beema和Mullins针对每一个设备增加了额外的温度测试接口,专门用于测试设备表面温度,只要这个温度依旧安全,那么处理器就会稳定运行在高频率上—当然,AMD还设置了一个阙值,芯片温度不能超过100℃。当设备的外部温度达到了设定上限或者芯片达到了100℃时,处理器都会立刻降低频率以保证安全。AMD宣称这样的设计不需要改变处理器本身结构,也不会带来额外的负担。据信AMD会联合设备OEM厂商对每款不同的设备外部设置相应的温度探头,以保证在长期运行时设备的安全与稳定性。

此外,AMD还特别说明了新的动态频率调整是完全智能的,频率调节会根据软件的情况来进行合理的加速。

AMD的STAPM技术很好地解决了产品的温度和频率控制问题。
AMD的STAPM技术很好地解决了产品的温度和频率控制问题。

加入ARM安全模块

AMD的加速技术会针对不同的应用采用不同的方案,智能决定是否加速。
AMD的加速技术会针对不同的应用采用不同的方案,智能决定是否加速。

AMD在产品中加入了ARM架构的核心,作为专门的安全处理器,保障整个设备平台的安全。
AMD在产品中加入了ARM架构的核心,作为专门的安全处理器,保障整个设备平台的安全。

早在2012年,AMD就宣布自己购买了ARM的相关授权,准备开发基于ARM的产品。当时AMD宣称和ARM合作会主要集中在AMD的Opteron处理器上,这类服务器处理器将使用ARM的Cortex-A5架构用于执行相关的安全操作。实际上AMD需要类似的硬件安全平台才能更好地保持自己的竞争力,相比之下,英特尔有命名为TXT的安全模块,并且没有授权给AMD,所以AMD才开发出来了TrustZone。

事实上在上一代的产品中,AMD已经为Kabini和Temash APU集成了Cortex-A5核心,不过当时由于种种原因他们并没有启用。在全新的Beema和Mullins上,AMD终于启用了安全模块并命名为平台安全处理器,也就是Platform Security Processor,简称为PSP。

AMD新加入的PSP模块拥有单独的处理器、ROM和SRAM,支持目前比较常见的诸如ECC、SHA、RSA、AES、Zlib、TRNG等多种加密算法,并且能够直接访问系统内存,调用资源。这样的设计使得AMD的新产品在运行有关安全设置的应用时显得更为得心应手。

能耗比提升极高 基于AMD Mullins的平板性能测试

那么新一代低功耗APU的性能到底如何呢?AMD率先为我们展示了他们采用Mullins APU的平板性能。AMD的这款参考平板尺寸为11.6英寸,显示屏幕分辨率为1080p,安装了Windows 8.1操作系统,处理器型号为Mullins中的高端产品A10 Micro-6700T。

首先让我们来看看在JavaScript性能和网页浏览的测试结果,在这些测试中,AMD的产品均获得了领先,尤其是以较大幅度胜出了英特尔的Bay Trail和苹果A7。而在CPU单线程性能测试中,AMD的Mullins比英特尔的Silvermont Atom Z3770快了大约35%,且能提供大约相当于80%的AMD桌面APU A10-4600M的性能,这是非常令人惊讶的。和第一代APU Llano架构的A8-3500M相比,Mullins则大约能达到其85%的性能。而在CINEBENCH R11.5 CPU多线程性能测试中,Mullins和英特尔的对比产品性能基本相当,甚至赶上了上代Kabini这样TDP高达15W的产品,要知道这款A10 Micro-6700T的TDP功耗仅为4.5W。此外,相比AMD之前老架构的E-350,性能翻了一番还多。

分享到:

用户评论

用户名:

密码: