MCPLive > 杂志文章 > AMD PUMA+低功耗APU技术与性能分析

AMD PUMA+低功耗APU技术与性能分析

2014-07-31张平《微型计算机》2014年7月上

不要以为AMD与英特尔的战场只有酷睿与Kaveri,AMD与英特尔早已展开一场全面的战争。从英特尔推出Atom,进入超低功耗处理器市场开始,AMD就针锋相对地推出了相应的产品和英特尔竞争。之前AMD已推出过代号分别为Brazos、Kabini和Temash的多代超低功耗产品,不过市场反响不算出色。而在今年四月底,AMD则发布了它们全新一代、代号为Beema和Mullins的超低功耗APU。这一次,AMD又有怎样的改变?Beema和Mullins又有哪些绝活呢?

AMD PUMA+低功耗APU技术与性能分析

事实上,AMD在超低功耗CPU市场早已耕耘多年,去年还发布了每瓦特性能非常出色的Kabini和Temash APU,但市场反应并不理想。在这些产品中,尽管低功耗APU的TDP低能够下探至15W,而其中超低功耗的1GHz双核心产品功耗更是降低至3.9W,但相比英特尔已经将超极本的Haswell处理器TDP功耗降低到15W以内,同时能提供更强悍的CPU性能而言,AMD的这些产品除了价格以外就没有太多亮点。尤其是英特尔发布了Bay Trail架构的产品后,英特尔展示了自己是如何使得类似的产品运行在更高的性能上,同时TDP又保持在8W以内的。这样一来,AMD必须更新自己的产品线,才能尽可能多地保持自己的竞争力。

终于在2014年,AMD发布了代号为Beema和Mullins的超低功耗APU。虽然有两个代号,但这两款产品实际上采用了完全相同的Puma+(美洲狮)架构。其中Beema面向的是入门级或者超便携的笔记本电脑,而Mullins则更偏向于平板电脑。这两款产品都是为Windows市场而设计的。

从架构角度来说,AMD在Beema和Mullins上也并没有彻底更新架构设计。Beema和Mullins的根本改变在于将制程从TSMC 28nm转移到了GlobalFoundries的 28nm,同时在架构和设计上进行了一些调整。作为从AMD拆分出去的晶圆工厂,GlobalFoundries一直以来都在新工艺研发上困难重重,这次的超低功耗处理器能够顺利在GlobalFoundries工厂投产,证明GlobalFoundries已经从之前的技术泥潭中抽身而出。所以在了解AMD的新品之前,让我们先来看看有关GlobalFoundries 28nm工艺的情况。

后的Gate First?GlobalFoundries 28nm工艺解析

说起GlobalFoundries在工艺上的跌跌撞撞,不得不提及Gate First和Gate Last。Gate First和Gate Last实际上是在进入45nm以后,以IBM为核心的阵营和以英特尔为核心的阵营在未来工艺发展上的一次分歧。终以英特尔大胜、IBM失败告终。

Gate First和Gate Last都是半导体制造的其中一步,其中Gate First是指先为晶圆生成金属栅极,再进行漏区、源区的离子注入,后进行退火操作;Gate Last则完全相反,其生产流程是先注入离子,再退火,后才生成金属栅极结构。这两种方法在当时看起来各有优劣,Gate First工艺简单,但是随后的高温退火可能影响栅极尤其是PMOS的性能,并且对栅极金属性能要求较高。而Gate Last虽然对栅极金属性能要求不那么高,但是工艺更为复杂。

目前GlobalFoundries主力推荐的28nm生产工艺有HPP和SLP两种。
目前GlobalFoundries主力推荐的28nm生产工艺有HPP和SLP两种。

IBM在Gate First上已经研究了10年之久,并且IBM认为Gate First是进入45nm时代后应该选择的工艺,还成功拉拢了三星、TSMC、AMD作为自己的盟友,而英特尔一方坚持Gate Last才符合未来发展的需求。不过随着研究进展的深入,IBM和盟友们发现,Gate First多只能坚持到28nm,就会由于材料和高温的问题而无法使用,反倒英特尔是正确的,Gate Last虽然短期内看起来麻烦一些,但是一直在28nm以后的工艺都可以继续使用。

AMD公布的Mullins核心架构图,可以看到,它拥有四颗Puma+ CPU核心。
AMD公布的Mullins核心架构图,可以看到,它拥有四颗Puma+ CPU核心。

当发现问题后,三星虽然嘴上说会提供Gate First的产品,但是却发布了新的论文,将支持Gate Last的研究。TSMC也宣布在28nm以后全面转向新工艺,不再考虑Gate First。不过AMD就有点麻烦了,受制于财务问题再加上企业并购拆分,AMD的晶圆厂在工艺上的进展一直很不顺利,随后拆分出去的GlobalFoundries在32nm工艺和28nm工艺上都摔了跟头,直到2013年才彻底搞定了28nm Gate First High-k Metal Gate的全部技术问题,得到了和预想中一样的产品。但是这个时候,英特尔的FinFET 22nm已经投产多时,14nm也已经箭在弦上了。

采用Beema架构的产品比上一代Kabini APU的能耗比综合提升了约20%。
采用Beema架构的产品比上一代Kabini APU的能耗比综合提升了约20%。

目前GlobalFoundries提供三种28nm工艺供用户选择,其中有专门为超低功耗设备设计的28nm SLP(Super Low Power)、为高性能设备设计的28nm HPP(High Performance-Plus)以及兼顾高性能和低功耗的28nm LPH(Low Power, High Performance)。其中28nm SLP为便宜,28nm HPP价格为昂贵,中间的则是28nm LPH工艺。不过在比较新的宣传内容中,已经看不到28nm LPH工艺的内容了,可能是GlobalFoundries考虑到市场和生产的问题,取消了LPH工艺。

AMD在功耗控制技术上获得了巨大的发展,处理器待机功耗逐年得到降低。
AMD在功耗控制技术上获得了巨大的发展,处理器待机功耗逐年得到降低。

根据GlobalFoundries的官方资料,28nm HPP工艺和SLP工艺对比40/45nm时代的类似工艺,有显著的优势。比如28nm的HPP工艺比40G工艺性能提高20%,同时功耗降低大约40%;28nm SLP工艺相比低功耗的40LP工艺速度提升高达30%,功耗也多降低了40%。无论是哪种28nm工艺,芯片面积都只有40/45nm工艺的一半左右,大大节省了成本。

目前没有资料表示AMD的新APU使用了哪种工艺,不过据推测使用28nm HPP的可能性更高一些,这个工艺本身就是面向高性能设备使用的,核心电压又比较低,能够达到更高的性能功耗比。至于28nm SLP,面向的是超低功耗领域,比如手机、蓝牙模块等,本身频率高只能达到1.8GHz。当然不排除AMD分别使用这两种工艺的可能。总的来说,目前在AMD的Beema和Mullins上所使用的28nm工艺,很可能是后一代使用Gate First的产品了,未来GlobalFoundries也将转向Gate Last工艺,并加入FinFET大军中去。

更低的功耗指标

前面我们已经说过,Beema和Mullins实际上并没有包含太多的架构方面的调整,AMD在转换工艺的同时,加入了大量频率控制和功耗控制技术,显著提高了产品的性能功耗比并降低了TDP指标。根据AMD给出的功能模块图,一个典型的Beema或Mullins芯片拥有四个Puma+ CPU核心,含有128个流处理单元的GCN架构GPU核心,以及显示模块、PCI-E总线模块、UVD影像模块、DDR3L内存控制器、北桥、2MB共享L2缓存、VCE视频编码模块、FCH(Fusion controller hub)南桥功能模块以及平台安全处理器PSP模块,这所有的模块组合在一起组成了复杂的Beema或Mullins APU芯片。

测试表明AMD的Mullins APU在电子阅读应用下,功耗相对上一代产品有明显降低,不过依旧赶不上ARM架构的移动SOC。
测试表明AMD的Mullins APU在电子阅读应用下,功耗相对上一代产品有明显降低,不过依旧赶不上ARM架构的移动SOC。

分享到:

用户评论

用户名:

密码: