很明显,包含Atom Z2460处理器在内的英特尔Medfield平台,是英特尔进入手持移动互联领域的关键一步。不过,x86相比RISC,英特尔对比ARM,复杂指令集对比精简指令集,“高功耗”对比超节能,Atom Z2460有胜算吗?这款新产品有哪些值得关注的“奇思妙想”呢?
根据英特尔在CES 2012上公布的资料来看,Medfield平台和之前的Moorestown有明显不同。之前的Moorestown平台采用了双芯片架构,包含了一颗英特尔Atom Z600系列处理器以及一颗平台控制集线器,前者拥有CPU和GPU核心,主要提供计算性能;后者主要提供互联和无线等功能,其作用类似桌面主板的PCH。虽然Moorestown平台已经在功耗控制方面不遗余力,但双芯片设计和相对ARM处理器较高的功耗依旧使得它的推广受到了限制。
在新的Medfield平台上,英特尔用一颗芯片解决了几乎所有的问题(不含基带),这就是Atom Z2460:它拥有英特尔进军手持互联移动设备以来精巧的身躯和精简的方案结构。Atom Z2460集成了绝大多数的功能模块,包括内存控制器、32nm的CPU核心、PowerVR SGX 540图形核心、512KB二级缓存、来自ImgTec的视频编码/解码引擎、视频输出模块、双通道LPDDR2内存控制器(每通道支持LPDDR2 800的内存,大可支持1GB)等。在制造方面,英特尔没有将所有的核心都平铺在基板上,而是采用了堆叠封装的方式来完成整个芯片的设计和制造,终得到了这颗面积大约62mm2的产品。单纯比较面积,它比首款双核心Cortex-A9处理器Tegra 2的49mm2略大一些,但基本和市售主流双核心Cortex-A9处理器差不多。
Atom Z2460的核心依旧是CPU和GPU。不过和ARM平台上CPU核心超快的进化速度相比,英特尔的移动平台多年来一直使用的Atom核心几乎没有做出任何更改。目前Atom Z2460中的单核心CPU和我们几年前看到的上网本内的那颗Atom,在内核架构上没有本质的区别,它们都采用了双发射设计(英特尔主流的桌面处理器已经全部是四发射设计),顺序执行架构(Pentium Pro以后就没有出现过顺序执行的主流CPU,不过ARM家族中的Cortex-A8依旧是顺序执行的架构),没有设计单独的整数乘法和除法单元(只能依靠浮点硬件来完成),内核拥有16级流水线(比ARM处理器普遍要长),拥有24KB L1数据缓存、32KB L1指令缓存以及512KB L2缓存。另外,Atom Z2460由于部分寄存器和指令序列的重复设计而获得了超线程技术的支持。
Medfield(左一)和上代Moorestown芯片(中、右两颗)大小对比。
从架构角度来说,Atom Z2460中集成的CPU与ARM 阵营的Cortex-A9很相似,比如缓存结构上,Cortex-A9也拥有32KB L1数据缓存和32KB L1指令缓存;指令结构方面二者都是双发射设计,都拥有两个解码单元,指令队列排序后进入整数和浮点运算。在整数方面,Cortex-A9有自己的整数乘法单元,有两个ALU单元(这一点和Atom Z2460相同)。但Cortex-A9相比Atom Z2460,没有专门的FP浮点单元,也没有FP/SSE单元(压根不支持SSE多媒体指令集),只有一个单独的VFPv3/NEON模块用于处理一些有关浮点计算的操作。
虽然从CPU架构来看,Atom Z2460相比ARM的Cortex-A9不会强太多,但Cortex-A9的内存控制器不如Atom Z2460优秀,内存带宽过低,CPU缓存命中率不高,这在很大程度上影响了处理器的性能发挥。这样的劣势在Cortex-A15之后才能得到一定程度的解决,因此Atom Z2460会有一定的领先空间。
Atom Z2460的CPU架构图
和上代产品Moorestown一样,Medfield中的GPU也来自于Powe rVR,不过型号由Powe rVR SGX 535升级成更优秀的PowerVR SGX 540——这颗GPU核心在200MHz下就拥有28MT/s的纹理填充率和接近1000MP/s的像素填充率,浮点运算能力达到了7.2GFLOPS。而且Atom Z2460中的GPU实际主频达到了400MHz,性能还要比200MHz的型号快很多(英特尔给出的数据是2000MP/s的像素填充率和40MT/s的纹理填充率)。依照惯例,英特尔依旧称呼这颗GPU产品为Graphics Media Accelerator,也就是我们熟知的GMA集成显卡。
Atom Z2460支持MPEG 4.2、H.264、WMV、VC-1等各种编码格式的硬解码功能,播放高清不再是什么难题。视频输出上,Atom Z2460高支持1280×1024分辨率的视频输出,借助HDMI接口可以输出1080p/30fps的视频。目前很多手持移动设备都可以作为小型高清播放平台接驳大屏幕视频设备,英特尔也看准了这一潮流给予了有力的支持。
看过Moorestown平台介绍文章的读者(2010年9月下《英特尔的移动通讯野心—Moorestown超低功耗平台揭秘》),应该对Moorestown采用的超低功耗技术相当熟悉。Atom Z2460正是使用了类似的技术,并对其进行了进一步的优化。
Atom Z2460定义了C6功耗级别。在这个级别下,几乎所有的核心和缓存都处于关闭状态,总功耗接近0W。当CPU接收到任务开始运作时,并不是瞬间唤醒,而是从0开始,以100MHz为基准,一步一步增加频率直到1.6GHz。在普通状态下,CPU高运行频率不超过1.3GHz,只有在特殊情况下才运行在1.6GHz的高位上—这有点类似桌面和x86移动平台的睿频技术。
另外,Atom Z2460还隐藏了256KB的超低功耗缓存,用于待机、低任务状态时系统使用。不过目前所有的内部架构图中,这256KB都被“隐藏”起来,并未明确标识。
除了优秀的节能设计外,Atom Z2460另一个优势之处在于其出色的制程工艺。英特尔在Medfield平台上采用了专门为低功耗设备优化的32nm LP工艺,漏电率只有上代的1/10。从英特尔以及台积电公布的数据来看,英特尔的32nm工艺应该和台积电的28nm工艺在漏电率方面处于相同的水平线上。因此,Medfield比上代Moorestown在相同的总功耗级别下,要么降低43%的动态功耗,要么提升37%的运行频率,这是非常明显的进步。
为了证明自家产品功耗相当低,英特尔还公布了一组数据:
Medfield频率/功耗比
频率 | 100MHz | 600MHz | 1.3GHz | 1.6GHz |
芯片功耗 | 约50mW | 约175mW | 约500mW | 约750mW |
从数据来看,即使满载的状态下,这颗芯片功耗也小于1W。要知道Atom Z2460绝大部分时间都不会超过1.3GHz,功耗甚至会低于500mW。这样的功耗表现比某些双核心的Cortex-A9处理器还要优秀。
至于Atom Z2460的性能表现,我们可以看看英特尔给出的自家Medfield和竞争对手的功耗和性能对比图。一些比较可靠的消息来源证明,英特尔对比的是苹果A5 Cortex-A9双核心、三星的猎户座Cortex-A9双核心、德州仪器的OMAP Cortex-A9双核心、第一款Cortex-A9双核心处理器产品也就是NVIDIA的Tegra 2,以及依旧来自德州仪器的OMAP Cortex-A9双核心处理器。这五款机型已经覆盖了目前几乎所有的主流ARM核心厂商。英特尔挑选这些产品出来的含义就不言而喻了。
Medf ield和竞争对手的功耗和性能对比
在图中,上部的三个是功耗测试,从左到右分别表示在3G待机状态、音频回放以及720p视频播放时的整机功耗。下方三个代表了性能,从左到右分别是浏览器性能、JavaScript性能和图形性能测试。从英特尔公布的对比成绩来看,除了功耗测试Medfield没有拿到优外,性能测试优势明显。当然,我们还需要看到更多的第三方测试结果才能确定产品优劣,但英特尔自信满满地公布这样的成绩,也在很大程度上说明了Medfield的确值得期待。
低功耗和高性能,Atom Z2460意味着英特尔赢得了战争?显然还言之过早。因为双核心Cortex-A9处理器已经是去年的产品了,随着四核心Cortex-A9以及双核心Cortex-A15陆续到来,Medfield又将面临新的压力。乐观地看,英特尔的性能优势多保持到2012年第三季度,在这段时间内,英特尔需要完成架构升级、采用全新的22nm工艺并继续控制新产品的功耗,才有可能真正站稳脚跟。
除此之外,英特尔目前还要面临平台兼容性问题。因为ARM毕竟是RISC精简指令集的产品,而Medfield是x86的CISC复杂指令集的。为了做到这一点,英特尔采用了二进制转换的方法,简单来说就是将ARM的原生库在执行前就转换成x86指令进行处理。这样的转换发生在底层,用户完全感觉不到任何差异。英特尔表示通过这样的手段可以保证90%的应用程序兼容性。好在Android NDK已经开始提供对x86和ARM的同时支持,因此未来x86处理器的兼容性应该不是难题。