开发节能型产品已成为人类社会的共识,无论是摩天大楼、汽车、家用电器都朝着节能的方向前进,作为能源消耗大户的计算机当然也跻身此列。我们日常所处的IT环境由掌上数字设备、
PC/笔记本电脑、服务器、网络设备共同构成,除了低耗能的掌上数字设备和网络设备外,其它的几种设备均是能耗大户,在拥有密集计算环境的领域,电费支出往往相当可观,这也使得相关企业越来越重视对节能技术的开发。
对PC设备来说,能耗大的主要有四大部件:其一是处理器,目前高端PC上用的四核处理器功耗水准普遍在120瓦以上,耗电量颇为可观;其二是图形系统,该领域的激烈竞争迫使NVIDIA、
AMD都竞相朝着高效能方向挺进,但也导致了显卡功耗从初的几十瓦飙升到现在的200~300瓦,耗电量极为惊人;第三个耗电的部件就是显示器,尽管LCD要比过去的CRT节能得多,但是大尺寸的LCD耗电普遍也在几十瓦级别,至于大屏幕平板电视,能耗普遍都在300瓦以上,显然这些设备是家庭中的耗电大户;第四个能耗高的对象就是存储系统,PC、笔记本电脑的硬盘仅消耗区区几瓦的电能,但服务器和企业存储系统中往往包含数量巨大的SAS硬盘,整体的能耗也颇为可观。
要降低计算系统的整体能耗,直观的做法就是降低芯片的功耗指标,半导体厂商除了积极通过导入新工艺来降低能耗外,优化芯片的设计、提高能效比以及发展节能技术也都是非常有效的途径,终实现能源的按需分配。而从宏观的角度来看,将任务指派给能源效率高的硬件是聪明的做法,从而实现整个系统的能源利用佳化,其中的典型例子就是将高并行计算任务交给GPU完成。如果从更长远的角度来看,云计算的普及可以让用户使用低能耗的“瘦终端”,从而有效降低整个IT环境的能源总消耗。而服务器本身则可以采取弹性的任务分派和灵活的能源配比来实现节能的目标。
处理器是PC系统耗能的关键部件,在总的方向上,提升效能与降低功耗永远都是一对矛盾,但是设计者仍有相当多的手段可以优化能源效率,使得性能的提升大于功耗的增长,这些措施横贯半导体工艺到芯片的架构设计等许多方面。
引入新工艺是降低芯片功耗直接的办法,无论从90纳米到65纳米,还是65纳米到45纳米,每一次制造工艺的提升,总是令芯片功耗大幅度降低—在同等情况下,芯片能耗往往可以有20%~
30%的可观降幅。新工艺使得芯片内的连接线宽更小,诸如High-K材料、SOI工艺等新技术的导入又大大削减了漏电流的产生,使得芯片的能耗值显著降低。现在,半导体工业开始朝着32纳米进军,英特尔公司将在2009年底推出32纳米处理器,标志着新一代工艺的成熟。台积电等代工企业也朝着40纳米进军,而IBM甚至开始向22纳米工艺迈进。
引入新工艺不仅能够降低制造成本和提高性能,同时也可以显著降低芯片的能耗
通过改革芯片的逻辑架构,实现能效的提升,这也是降低能耗的有效手段。这个领域的典型案例当属英特尔从Pentium 4到Core架构的改变,前者以能效低著称:芯片功耗巨大,同时效能不尽理想;而Core架构通过4路并行解码、宏指令融合与微指令融合等技术,大幅度提升了芯片的每瓦性能,终在获得性能大幅度提升的同时,显著降低了处理器的功耗水准。类似的例子还有当年
AMD从K7到K8的转换,K8架构将内存控制器集成,降低了内存延迟,借此处理器可获得20%左右的性能提升,而芯片的功耗并没有因此提升。
未来处理器设计构想:大量的协处理器将高效地完成特定任务处理
这样的节能思路在未来显然将会继续进行,作为一种先进的设计思想,协处理单元的纳入、构建超多核处理器已成为微处理器工业界的新趋势。所谓超多核处理器,即在当前双核、四核处理器的基础上,集成大量的协处理单元,这些协处理单元可以负责Java程序解释、物理计算、Flash硬件加速等,专用的协处理单元效率更高,在完成同样任务时消耗的能源更少,而主CPU单元只需负责任务的指派,通过这种主从协作模式,可以在显著提升效能的情况下同时实现能耗的降低。
AMD Turion 64 X2处理器中应用的能源独立分配技术,
CPU部分与总线部分的供电分离,实现能源按需配给。
能源的按需分配是处理器节能的另一个思路,事实上当前的移动处理器已经充分具有按需分配能源的风采了,以AMD Puma平台为例,其双核Turion 64 X2处理器的内存控制器、高速缓存与
CPU内核的供电分离,系统可以根据任务的需要来灵活决定能源的供应与否;同样,英特尔的移动处理器也引入类似技术—早在Pentium M时代,处理器的高速缓存就采用能源配比制度,即通常只有1/32的二级缓存处于供电状态,由于高速缓存一贯都是处理器的能耗大户,此项技术为Pentium M的能耗降低立下汗马功能。按需分配的另一个角度就是,根据任务需要来调整处理器的电压和频率,大家耳熟能详的英特尔SpeedStep技术、AMD PowerNow!便属此列。按需分配的思想未来将更为普遍,尤其是伴随着多核、超多核处理器流行,能源按需分配被认为是降低能耗的法宝。比如在处理简单的商务办公应用时,CPU只需开一个核心,并降低频率运作,如果需要完成多任务、或多线程程序,那么其它核心才被自动开启,这种按需运行的模式能够实现能源配置的佳化。
图形系统与微处理器系统非常相似,GPU是图形系统的核心,高性能GPU则是电力资源的杀手。而除了GPU之外,图形系统中的高速显存同样也是能源杀手。既然如此,节能技术就必须同时从GPU与显存系统着眼。
与处理器类似,导入新工艺是降低GPU和显存能耗的法宝,不过GPU与显存的逻辑结构都比较固定,能效改进的结构相当有限,所以无论NVIDIA还是AMD,都很难通过革新设计获得能源效率的提升,双方的性能竞赛更像是一场流处理器数量的堆砌,在这样的背景下,GPU能耗高是必然的,即便引入新的工艺,激烈市场竞争又会使得双方推出能耗高的新一代产品。
导入能源按需指派是非常理想的做法,事实上这也是图形工业一直努力的方向所在。我们知道,GPU内部除了负责3D渲染和通用计算的流处理器单元外,还具有2D显示、高清视频引擎等不同的逻辑单元,假如用户只是在处理办公文档,那么显卡其实只要求提供2D显示和能满足操作系统3D视觉的简单3D性能,此时GPU中的大多数流处理器都可以关闭,只需留下个位数的流处理单元和2D显示单元即可。当然显存系统的大部分供电也可以被关闭;假如用户在观赏视频,那么同样地,不需要使用的硬件单元可以暂时关闭。从技术上讲,这样的设计完全是可以实现的,NVIDIA在GPU中采用的PowerMizer技术、AMD的PowerPlay技术,都可以在一定程度上做到这一点。
类似PowerPlay的节能技术能够显著降低GPU的平均功耗指标
混合多显卡模式的出现,也能够有效降低整机的能耗。NVIDIA的Hybrid SLI技术体系中曾经支持一项名为Hybrid Power的节能技术,即当用户在从事一些非3D的常规任务时,独立显卡可以被关闭、系统只依靠芯片组集成的GPU来完成显示—由于集成GPU能耗要大大低于独立显卡,此举可以显著降低整机的能耗。不过,NVIDIA现在已经在桌面显卡中取消了这一技术,对此NVIDIA解释说其独立显卡目前已能支持高效的节能技术,在常规任务下显卡的能耗可以同集成GPU相差无几,
Hybrid Power就失去了价值。这一声明的背后源自NVIDIA的另一举措:在2008年8月份,NVIDIA以
2500万美金的代价获得全美达LongRun、LongRun2节能技术的授权,前者可以根据任务对芯片的频率/电压实施近乎动态的调整,后者则可以将芯片内部的漏电流削减到原先的1/70,相信这两项技术已逐渐融入NVIDIA的新一代产品中,使之能够获得理想的节能表现。假如NVIDIA能够在移动GPU中也快速导入这些技术的话,那么有望改变长久以来移动GPU能耗一直高于AMD的情况。
如果将注意力放在处理器、GPU局部,固然可以实现能源效率的提高,但未必能够做到能源利用的佳化。我们知道,CPU适合处理带分支预测的转向程序,而GPU适合3D渲染和高并行、不带分支的计算程序,假如让CPU来渲染3D图形,那么后果可想而知:在提供与GPU相同渲染性能的条件下,CPU所耗费的能源也许是GPU的100倍以上!这个例子告诉我们:任何一项计算任务,应该交给适合处理该任务的计算芯片,这样才能够实现能源利用的佳化。
NVIDIA Tesla通用加速卡,核心部件为GPU,它在高并行计算应用中效率远高于传统的CPU
但在现实应用中,违背此种情况的例子随处可见,比如气象模拟、DNA排序之类的科学计算都涉及到大量的复杂浮点运算,通常需要大型计算机方可胜任,而大型计算机中负责运算的则是微处理器。事实上,如果采用GPU来处理这些任务,那么效率会高出10倍以上,这意味着系统只要消耗少得多的能源,就能够完成同样的任务。在这个领域,NVIDIA目前同样居于领先地位,它所推出的CUDA平台在通用计算领域占据事实上的垄断,借助CUDA,开发者可以编写出GPU加速的计算程序,从而实现能源效率的大幅提升。
值得一提的是,通用计算同样可以用于普通的PC用户,比如说现在的图像处理、Flash播放都是依靠CPU进行的,在执行这类任务时,CPU占用率正常都在100%,假如能够支持GPU加速,那么任务可以完成得又快又好,所耗费的能源也要低得多。
随着GPU通用计算的不断成熟,GPU会承担越来越多的浮点计算任务,包括物理计算、光线追踪、图像处理、3D桌面、Flash播放、PDF阅览等许多应用领域。
硬盘本身已经是一个功耗很低的部件,继续在硬盘身上挖掘剩余能源显然是不现实的,因为目前硬盘工业紧要的问题是提升性能而非降低功耗。不过事事无绝对,随着应用的个性化,硬盘产品也出现包括发烧、性能、节能这样的产品细分。
西部数据GreenPower绿盘,以低转速获得更低的能源消耗,
适用于NAS、家庭服务器等不要求高效能的场合。
西部数据的GreenPower绿盘是节能硬盘的典范,这类节能型硬盘通常只有5400rpm的速度,而且在没有寻道、读写动作时可以处于休眠状态,因此它的读写性能要比常规硬盘慢一些,好处就是功耗只有常规硬盘的60%左右,每个硬盘平均可节省4~5瓦电能—对PC而言,区区4~5瓦功耗算不了什么,但对拥有成百上千个硬盘的数据仓库来说,所节约的能源就非常可观。因此对大型企业、数据中心等单位来说,改用节能型硬盘是降低运营成本的有效举措。
另一项节能措施就是根据情况、及早更换新款、大容量的硬盘。硬盘的能耗主要取决于电机系统,而与容量没有多大关系,一个1TB的硬盘,消耗的能源甚至可以比一个100GB硬盘还要低,那么用一个1TB硬盘来代替10个100GB硬盘,间接起到的效果就是将能耗值降低整整90%。因此对数据中心来说,虽然更换硬盘需耗费一定的成本,但从综合角度来看也许仍然划算。
LCD显示产品的功耗主要来自于背光系统,比如22英寸产品一般用2根CCFL灯管,24英寸以上就要使用4根,至于大尺寸液晶电视一般都具有8根灯管以上,否则无法满足符合要求的亮度输出。改用LED背光技术为LCD产品打开了节能的窗口—LED是一种半导体发光器件,属于片状光源,早期LED器件发光效率只有30lm/w(流明/瓦)左右,而CCFL发光效率基本都在60lm/W(流明/瓦)级别,在提供同样亮度时LED背光耗费的电能要比CCFL灯管高一倍。但在日亚(Nichia)为首的工业界的努力下,LED器件的光效逐年快速提高,目前商品化LED的光效普遍超过150lm/W,节能特性已全面优于CCFL。
LED背光源不仅自身节能特性较好,同时可以有灵活的部署,便于实现能源的按需输出
片状光源的性质让LED光源在配置上有更高的灵活性,从而为进一步节能打下基础—夏普在自己的液晶电视产品中引入了一种“区域点亮(Local Dimming)”技术,该技术采用直下型LED背照灯,1个画面被分割成多个区域,根据每个图像显示区域的亮度对LED进行点亮。夏普表示,该技术可以将液晶电视的即时耗电量减至原来的1/3,年耗电量减少一半,节能效果非常显著。
OLED显示器被视作LCD的接替者,从原理上讲,OLED构件更为简单,它就相当于一个可以在像素级别进行控制的LED器件,无需像LCD那样需经过液晶板的遮挡,输出的亮度直接抵达人眼。这种简单的结构赋予OLED出色的低能耗特性,只是受限于寿命问题,OLED产品预计在2012年前都很难进入实质性的商用化阶段,尽管如此,业界对这项革命性技术仍然高度期待。
无论是IBM、SUN还是Google,都将云计算视作计算工业的未来形态,IBM侧重于构建云计算的基础环境,SUN则实质性地推出硬件产品,而Google却推行着Gmail、Google Apps在内的多种云服务。假如云计算模式能够成为主导,计算能力变为像水、电一样的基础资源,那么整个社会的
IT环境耗电开支将会大大下降—尽管云计算需要大量强有力的服务器作为后端,但用户的终端设备可以实现“瘦身”和“低能耗”化,比如像智能手机这种级别的硬件就能够通过云计算平台畅玩大型3D游戏,高性能、高耗电、结构臃肿的PC机不再必要,由此可以节约出大量的能源。
云计算应用模式中,用户可以使用低耗能的便携终端,
这样宏观上整个IT环境的能源消耗有望显著降低。
从能效比的角度来看,云计算模式优于传统的PC应用,因为在云计算体系中,PC的能源浪费实际上被彻底杜绝,而服务器本身可以根据负载的需要进行部署,这意味着每一份电力都可以物尽其用,不会在闲置中白白浪费。
大型数据中心每个月动辄需要花费数百万的电费开支,如果能够降低服务器的能耗,就意味着企业能够出现可观的“额外利润”,正因为如此,企业用户对服务器的要求不再仅仅只是性能,低能耗的产品更受欢迎。
对拥有许多服务器的数据中心来说,如何从整体上保证能源使用的佳化就成为一个难题。在这个领域,IBM公司推出的EnergyScale技术堪称典范,该技术应用于IBM Power 6服务器系统中,它可以不停地收集服务器的功耗数据、并将这些数据显示在IBM的“Systems Director Active
Energy Manager”功耗管理软件中。通过这些数据,管理员可以预测一天、一周或一个月内数据中心的电能消耗情况,并对负载进行管理调控。假如所使用的服务器系统支持power capping功能的话,管理员还可以直接设定一个合适的高功耗水平、强迫服务器的整体功耗不超过这一设定值。此外,IBM服务器还支持Power Saver Mode省电模式,该模式允许管理员将CPU电压和频率下调一个固定的百分比,借此达到节能的目的。
IBM Power 6与Power 5服务器集群可支持灵活的功耗管理机制,可有效避免能源浪费
Power Saver Mode在实际应用中可以发挥不俗的效用,它可以将服务器平均功耗降低20%~
30%之多。另外,IBM Power 6处理器使用了一种名为“Nap”的低功耗模式,可以在无任务状态下停止处理器的执行,以此来降低功耗。假如操作系统处于空闲状态,Nap可以将整体能耗降低30%-35%;而当操作系统繁忙时,Nap也可以实现10%的功耗降低。后,Power 6也支持类似
SpeedStep的节能技术,它可以动态地调整处理器的频率和电压,从而有效降低运作功耗。
服务器节能的另一个方向就是采用专用途的芯片,该领域的成功案例就是SUN的UltraSPARC
T2(代号Niagara 2)平台,UltraSPARC T2拥有8个内核和64个线程,它的浮点运算功能非常弱小,而重点强调多线程的事务处理能力,因此虽然拥有8内核,但处理器的能耗也不到95瓦。
UltraSPARC T2的每个线程都可以独立运行一个操作系统,因此理论上一枚UltraSPARC T2处理器可以多支持64个系统并行,在Web服务器、邮件服务器、文件服务器在内的事务处理任务中,
UltraSPARC T2的每瓦性能达到英特尔Xeon平台的2.5倍,它也因此成为事务处理能效高的服务器处理器。
SUN UltraSPARC T2处理器支持CMT多线程技术,芯片本身的专用化设计使之具有理想的能源效率
专用化思想也蔓延到大型计算系统的构建,譬如在以浮点计算为主的集群系统中,GPU、Cell之类的协处理器被大量部署,这种设计比传统的单纯依靠处理器的模式更为科学。假如任务足够单一,那么硬件系统可以更为专业化,在很多时候,CPU反而可以成为配角,而依靠高效率的协处理器进行运算。与通用设计相比,这种专用设计虽然任务弹性很低,但在完成单一任务时可提供相当优秀的能源效率。
以按需分配思想取代现有的粗放式设计,以云计算代替传统的强PC模式,以专用设计取代通用设计,这三个思路将成为未来IT工业节能设计的主要方向。我们可以确信,未来的IT技术将对人类产生更为重要的影响,现有的商务、交流、娱乐、消费等活动将对IT环境越来越依赖,IT设备也将无处不在;而通过企业、开发者与用户的共同努力,我们将能看到,IT设备的能源消耗处于一种良性的范围内,在保持现有能耗的条件下,我们能够体验到更多精彩的应用—譬如电影级的超逼真
3D渲染、无处不在的虚拟现实、高保真的远程3D交互,当然还有更贴心的电子商务。