MCPLive > 杂志文章 > 英特尔DDR4平台发展动向解密

英特尔DDR4平台发展动向解密

2014-09-22何斌颖《微型计算机》2014年9月上

英特尔将面向发烧级玩家的产品和普通的桌面级产品从架构上进行了区隔,推出了专用接口的High End Desktop(HEDT)平台。

从LGA 1366到LGA 2011,顶级平台一直以高昂的价格和超群的性能出现在人们的面前。在2014年下半年,英特尔又将为我们带来全新的HEDT平台—Haswell-E架构,和这个平台相关的处理器、主板芯片组、内存都全线更新。它们都有什么特点?性能如何?未来还将如何发展?就让我们提前一探究竟。

Haswell-E:首款英特尔民用八核心处理器

作为HEDT平台的核心,高性能处理器是整个平台的关键。桌面处理器在进入双核心、四核心时代后,发展速度就慢了下来,之前英特尔也仅仅在顶级平台上推出过六核心处理器。相比之下,竞争对手AMD反而更积极一些,四模块八核心的推土机架构拿下了民用市场桌面首个八核心处理器的头衔。不过受制于性能,一直很难得到顶级玩家的青睐。这一次,英特尔推出了全新的Haswell-E架构,将强大的英特尔八核心处理器带向桌面市场。

Haswell-E是英特尔首款八核心处理器,专为顶级玩家设计。
Haswell-E是英特尔首款八核心处理器,专为顶级玩家设计。

八核心:性能高提升45%

Haswell-E处理器和目前桌面流行的Haswell的关系非常近,与之前的IvyBridge-E和IvyBridge、SandyBridge-E和SandyBridge的关系类似。从架构角度来说,Haswell-E和Haswell在核心微架构上是基本相同的,都拥有诸如改进的电源管理、增加的分派端口、AVX2指令集、TSX扩展(由于出现重大BUG因此在目前的产品中被禁用了)等。除了核心微架构外,Haswell-E和Haswell在非核心部分的设计存在比较明显的差异,比如在总线、缓存结构等方面,由于Haswell-E精简自更高端的服务器产品,因此在这部分的设计上要比民用版本的Haswell更为复杂—也正是更为复杂的设计,使得Haswell-E能够更有效地支撑多核心应用和扩展。有关这部分内容,英特尔暂时没有太多消息披露,因此尚无法给出详细解读。

Haswell-E目前高拥有8个非模块化、独立的物理核心,加上英特尔的超线程技术,八核心的Haswell-E能够提供16线程并行运作,在Windows任务管理器中看起来应该蔚为壮观。英特尔宣称八核心的Haswell-E相比四核心的Haswell能够带来多45%的多线程性能提升:核心数量翻了一番,性能只能提升多45%,这从一个侧面也说明了即使在总线和缓存架构上给予更强的支持,Haswell-E在Amdahl定律(系统中对某一部件采用更快执行方式所能获得的系统性能改进程度,取决于这种执行方式被使用的频率,或所占总执行时间的比例。)约束下进一步依靠增加核心数量来提升性能已经比较难以有明显效果了。

四通道DDR4

Haswell-E随着核心数量增加也提升了三级缓存容量—从之前IvyBridge-E六核心的大15MB提升至Haswell-E八核心大20MB。另外值得一提的是内存规格,Haswell-E支持大四通道DDR4 2133规范,相比之前IvyBridge-E的大四通道DDR3 1866,不但在带宽上得到了提升,也彻底进入了DDR4时代。
四通道DDR4 2133内存能够为Haswell-E提供大68.2GB/s的带宽,相比目前桌面Haswell的25.6GB/s高了大约1.6倍。可能是英特尔考虑到八核心的需求,再加上HEDT平台的用户对价格普遍不敏感,因此才终决定使用如此强悍的内存配置。

40条PCI-E通道

由于目前英特尔处理器基本接管了北桥的功能,因此处理器为系统提供主要的PCI-E总线。Haswell-E多可以支持40个PCI-E 3.0通道。在理想的情况下,用户可以使用CPU提供的PCI-E总线搭建PCI-E x16+PCI-E x16的双卡系统,或者使用“x8+x8+x8+x8”的方式组建四路GPU系统。即使这样,Haswell-E还额外留有8条PCI-E3.0通道给其他设备,比如SATA-Express、M.2、千兆网卡等。在极端的情况下,借助于主板厂商设计以及第三方芯片的帮助,X99可以支持5个PCI-E 3.0 x8通道,能够实现5卡互联。如此多的PCI-E通道,不但带来了使用上的方便,也增强了系统的扩展能力,满足顶级玩家对带宽的渴求。

Haswell-E系统架构示意图,支持四通道DDR4内存。
Haswell-E系统架构示意图,支持四通道DDR4内存。

改善的超频性能

Haswell-E和之前的顶级处理器一样,都会推出不锁倍频的版本。除了这些版本外,Haswell-E在超频方面还做出了一些改进,核心倍频高支持80倍、完全解锁内存控制器超频限制、PCH超频支持以1MHz为步进的调节、PEG和DMI倍频比例可选等。总而言之,对超频玩家来说,Haswell-E的可玩性应该很不错。

目前已经曝光的LGA2011-E接口的ES处理器顶盖图,可见大变化在于顶盖上下两侧的“护翼”。
目前已经曝光的LGA2011-E接口的ES处理器顶盖图,可见大变化在于顶盖上下两侧的“护翼”。

在ComputeX上,很多厂商已经迫不及待的曝光了X99主板。
在ComputeX上,很多厂商已经迫不及待的曝光了X99主板。

说起超频,就不得不提及另一个指标:TDP。由于核心数量增加等原因,Haswell-E的TDP功耗比上代IvyBridge-E的130W略有增加。Haswell-E的TDP提高到了140W。为了控制散热,英特尔提供了水冷和风冷散热器供用户选择。

此外,Haswell-E的制程依旧使用了目前为成熟的22nm工艺,并没有使用英特尔下一代处理器将使用的14nm新工艺。之前英特尔在桌面版本的处理器使用的22nm Fin-FET工艺上出现了漏电较高、温度较高等问题,导致Haswell在超频和温度上的表现并不出色,这次Haswell-E的核心面积显然会更大、功耗也会更高,不知道超频表现是否还会受到工艺的限制。

英特尔公布的X99芯片组架构图。
英特尔公布的X99芯片组架构图。

后说一下处理器的接口,Haswell-E使用LGA 2011-E接口,虽然针脚触点还是2011个,但是相比之前IvyBridge-E所使用的LGA 2011-0版本而言,新的LGA 2011-E无论是物理尺寸还是针脚定义都和上代产品完全不同。LGA 2011-E的插槽长度为49.2mm,宽度为38.14mm,比上代产品的长43mm,宽38.5mm更大,因此如果要使用全新的Haswell-E处理器,购买一款新的使用X99芯片组的主板也就必不可少了。

X99:承载Haswell-E的新平台

目前英特尔在HEDT平台上的主板采用的是X79芯片组,而即将搭配Haswell-E的则是X99。由于从SandyBridge-E开始英特尔就将北桥彻底集成在了CPU中,因此芯片组也只是传统意义上的南桥而已,相比前代产品X79,X99的技术改进也并不明显。

作为一款事实上的南桥芯片,X99主要的功能是提供大量的扩展接口,在这一点上X99没有让用户失望。根据英特尔的资料,X99提供了多达14个USB接口,其中6个USB 3.0、8个USB 2.0,此外还有10个SATA 6.0Gbps接口、千兆网卡等接口。X99还自带了8个PCI-E 2.0通道,可以供一些厂商提供诸如SATA-E、M.2等磁盘接口使用。不过需要注意的是,相比CPU内部集成的PCI-E通道,X99芯片组的PCI-E通道是通过带宽为4GB/s的DMI 2.0总线和CPU相连的。如果使用太多设备在南桥连接的话,可能会带来带宽不足的问题,因此高端主板更愿意使用CPU端引出的PCI-E通道来连接诸如高速SSD、千兆网卡等快速设备。

由于X99芯片组只起到南桥的作用,功能不复杂,因此功耗也比较低,TDP功耗只有6.5W,一般主板上使用一个散热片就能解决其散热问题。制程方面,X99芯片组应该使用的是比较老的45nm或者32nm工艺,比CPU工艺要落后很多,但也足够了。

总的来说,英特尔在Haswell-E上的升级依旧只能说是按部就班,几乎没有出现任何革命性的改变。不过考虑到目前整个PC市场的大环境以及英特尔每年谨小慎微的升级步伐,PC已经进入了成熟稳定的发展期,主板芯片组几乎不再会出现什么重大变化了,而这样的态势估计还将持续很久。

DDR4:速度更快、功耗更低

而在本次平台升级过程中,重要的变化就是内存从DDR3升级到DDR4。内存在进入DDR3时代后,已经稳定发展了接近7年,频率从早期的DDR3 667、DDR3 800发展到目前的DDR3 2133甚至DDR3 2600,已经基本达到了DDR3技术的极限。从2012年开始,内存组织JEDEC就开始推广有关DDR4内存的相关内容,同时厂商也在2013、2014年开始生产DDR4内存。

目前已经有厂商展示了DDR4内存,注意看金手指部分不是直线。
目前已经有厂商展示了DDR4内存,注意看金手指部分不是直线。

目前已经有多家厂商发布了自己的DDR4内存。从这些产品来看,内存规格从DDR4 2133起跳,单条容量也高达8GB以上,甚至有厂商推出了单条32GB的DDR4内存。实际上,目前DDR3内存受限于架构,产品频率提升已基本濒临极限,未来系统带宽的提升需要更为强悍的内存架构来支持,DDR4在这个时候开始推出并进入市场,是整个PC行业继续发展的重要一环。

DDR内存基本架构对比图,下方为DDR4
DDR内存基本架构对比图,下方为DDR4

由于DDR4内存和DDR3内存使用了完全不同的架构,因此其具体技术内容还是非常值得深究的。有关DDR4技术的内容,本刊在2013年五月下的《功耗更低,频率更高,性能更强—DDR4内存全景解析》一文中已经给出了比较深入的解读,本文仅对DDR4内存的相关重要技术点给予简单介绍。

DDR4:未来的内存标准

内存的发展和CPU、GPU等产品有着较大不同,那就是内存规范本身没有竞争,内存的设计和规格也是由JEDEC组织基本确定的,各个厂商只能在制造层面做出一些调整。在DDR4上,JEDEC推出的DDR4标准有着以下的特点。

首先,DDR4内存为了达到更大的预取数和更高的带宽,在内部结构上做出了很大的调整。DDR4内存采用了Bank Group设计,内部可以拥有两个到四个Bank Group,这些Bank Group采用并行的方式运作,数据进入内存后,会被分成相同的数个数据包送入不同的Bank Group中。此外,DDR4内存在I/O,内存总线部分也做出了大量的调整,终使得内存的带宽得到了大幅度提升。

英特尔公布的14nm对比22nm晶体管显微照相图。
英特尔公布的14nm对比22nm晶体管显微照相图。

其次,DDR4内存重要的核心技术指标—预取数,相比DDR3没有做出改变,依旧使用的是8bit预取,每次传输数据是以8bit为单位。但根据目前已知的资料,DDR4采用了全新的Bank Group结构后,每个Bank Group每个周期都可以实现8bit预取。现有的DDR4结构一般会设计2个Bank Group,这样就相当于将预取数提升到了2个8bit,也就是相当于16bit预取(虽然其本质完全不同,但是数据意义上可以简单的这样类比)。反映在名义频率上,DDR4的名义频率要比DDR3整整高一倍,这也是DDR4内存高带宽的来源。

第三,DDR4采用了全新设计的点对点总线技术。和DDR3采用的多点分支总线不同的是,传统的多点分支总线在一个内存通道上可以支持使用多个内存,比如某CPU支持双通道内存,那么可以插入2个内存条、4个内存条甚至更多的8个,但是通道数量只有2个。点对点内存则不是这样,它的每个内存通道只支持唯一的内存。这样设计的好处是可以尽可能多地使用内存的位宽资源,并且设计难度较低、能够支持更高的内存频率。虽然DDR4内存采用了点对点设计,但这并不意味着用户只能使用和内存通道数相同的内存根数,由于Switch Fabric的存在,用户依旧和DDR3时代一样,只需要在使用DDR4内存时正确的将内存插入插槽即可。

14nm的产品面积只有22nm产品的54%。
14nm的产品面积只有22nm产品的54%。

说到这里,DDR4的重要技术点就基本说完了。当然,对用户来说,技术上的内容终究太远,具体到产品上来才更为贴切。那么DDR4内存的外观和规范方面又和DDR3有哪些不同呢?

从外观来看,DDR4内存值得关注的是金手指不再笔直、且触点更多;其次是防呆口更靠近中心。其他方面,比如DDR4内存的长、宽和高,和DDR3内存没有太多差异。之前包括DDR3以及DDR2在内的所有内存,还有显卡、声卡、网卡等扩展卡的金手指都是直的。这样的设计使得金手指和内存插槽接触比较牢固,但摩擦力过高,导致内存难以插拔,反而影响到了易用性。因此在DDR4上,内存金手指被改成中间略高、两边略低的凸形设计。这样的设计一方面可以保证内存的坚固稳定,另一方面由于两端金手指变低,因此插拔起来也会更为容易。此外,DDR4内存的金手指数量更多,有284个触点,比DDR3的240个有比较明显的增加。

性能和规格上,DDR4内存的带宽也随着规格和技术的提升而大幅度提升。目前DDR4内存规格多从DDR4 2133起跳,短期内高可达DDR4 3200,远期甚至可高达DDR4 4200甚至更高。在带宽方面,以目前主流的双通道内存为例,DDR3内存的主流规范是DDR3 1600,双通道带宽为25.6GB/s,已经逼近DDR3规范极限的DDR3 2133内存双通道带宽为34.1GB/s。与之相对应的是,目前DDR4初始阶段的DDR4 2133双通道内存带宽就为34.1GB/s,随后的DDR4 3200的带宽就会飙升至51.2GB/s,远期的DDR4 4200双通道内存的带宽更是高达67.2GB/s,发展潜力巨大。

虽然DDR4有很多优点,带宽潜力也大,但是毕竟是一个新生事物。目前DDR4内存价格非常昂贵,相比同等容量的DDR3内存,价格基本是DDR3的5倍甚至10倍,着实令很多玩家难以接受。另外,根据英特尔、三星等厂商的估计,DDR4内存在2014年开始出售,2015年会逐渐扩大市场份额同时价格也会下降,到了2016年DDR4内存会基本占据市场主流地位。也就是说,DDR4内存从发布到普及,还有将近两年的时间。在这两年时间中,英特尔等PC行业的领军厂商,也将在新平台上逐渐过渡,以配合DDR4内存的发展以及行业换代。

Skylake-S—过渡时期的选择

说完了顶级市场,再来看看民用级市场DDR4内存的普及情况。在之前的路线图上,英特尔在Haswell后应该推出14nm的Broadwell。不过随着英特尔计划的改变,14nm工艺无法达到要求等问题接连出现,英特尔不得不将Haswell的生命周期延长,推出了频率提升、小改版本的Haswell Refresh和90系列芯片组。原定的Broadwell(只支持DDR3)也随之延期到了2014年底甚至2015年初。不过在DDR4内存即将普及的情况下,英特尔在主流市场上也必须做出一些改变,于是,英特尔在未来规划了全新的Skylake-S处理器和100系列芯片组,通过对DDR4和DDR3L系列内存的“通吃”,在过渡时期为消费者和OEM厂商提供“缓冲”。

英特尔公布的Skylake产品介绍,深入内容不多,大多集中在功能性介绍方面。
英特尔公布的Skylake产品介绍,深入内容不多,大多集中在功能性介绍方面。

Skylake:全新架构、全新工艺

目前有关Skylake的内容披露不多,因此在架构改进方面没有太多的细节,本文主要的介绍还是集中在相关规格和功能的改进上。英特尔在工艺的研发上一向是业内领先,独步全球的。这次在14nm工艺的研发上,英特尔又做到了全球首家商业化。目前情况显示,英特尔至少将领先各个竞争对手同档次的工艺水平一年以上。英特尔14nm工艺将首先使用在Broadwell处理器上,不过根据英特尔的路线图,Broadwell将在2015年第二季度和Skylake的桌面版本Skylake-S一同上市,其中前者主打高性能、不锁倍频的中高端市场,后者主推主流市场,两者都将使用同样的14nm工艺。因此,Skylake全系列也同样使用14nm工艺。

说起14nm新工艺的大优势,那就是芯片面积进一步缩小。根据英特尔的数据,同等规格的SRAM存储单元,14nm产品的尺寸只有22nm产品的54%,几乎缩小至原来的一半。更小的芯片面积有助于切割出更多的芯片,降低了成本。此外,新的14nm工艺在细节上也做出了很多改进,因此英特尔称其为第二代三栅极晶体管技术(之前的产品称为第一代三栅极晶体管技术,也就是英特尔一直宣称的3D晶体管)。相比老的技术,新技术将晶体管的鳍片高度从之前的34nm增加到了42nm、鳍片间距从之前的60nm缩小到了这一代的42nm,这一系列改变提升了晶体管驱动电流的同时还降低了电容,提升了产品的性能表现。英特尔宣称14nm工艺的产品的性能功耗比是上代22nm产品的两倍甚至更多。

总的来说,全新的工艺使得英特尔在产品端游刃有余—既可以推出高频率产品应对市场竞争,又能推出超低功耗产品实现便捷移动,或者使用更多的晶体管和技术达到更高的性能。总之,14nm的成熟和商业化,使得英特尔将继续保持它显著领先的态势,也没有任何厂商可以动摇英特尔稳固的根基。

Skylake详细的支持设备情况,其中蓝色的是All in One设备支持的,绿色则是桌面设备支持,其余的两者都可以支持。
Skylake详细的支持设备情况,其中蓝色的是All in One设备支持的,绿色则是桌面设备支持,其余的两者都可以支持。

Skylake:支持DDR4和DDR3L

作为英特尔全新架构的产品,Skylake在架构特性上还是有不少的改变。英特尔着重点出了三点:全新的CPU架构、更快的图形性能以及更低的功耗。

首先来看全新的CPU架构。从SandyBridge到现在,每一代纯粹架构提升带来的性能增加应该在5%左右,因此在Skylake上,英特尔很可能也维持这个幅度,依靠每一代对架构的小幅改进来提升性能。另外,Skylake使用的是全新的LGA 1151接口,和之前所有产品都不兼容,因此只能搭配全新的主板和100系列芯片组使用。

其次是图形和相关部分。英特尔宣称Skylake将会集成全新架构的GPU,在API方面支持DirectX 12、OpenGL 5.x以及OpenCL 2.x。输出方面支持高4096×2304的4K超高清分辨率。性能方面英特尔宣称会比目前的产品有比较大的改善。在视频部分,Skylake拥有新的编解码模块,可以支持HEVC、VP8以及VP9等视频格式的编解码。输出方面,Skylake支持三个DisplayPort接口,包括eDP接口在内。在外接独立显卡的能力方面,Skylake和Haswell等产品一样支持一条PCI-E 3.0 x16通道,搭配某些芯片组时可以拆分组建多卡系统。

在功耗方面,新的Skylake处理器将拥有三个不同的功耗档次。顶级的狂热级四核心产品功耗为95W,预计不锁倍频的Skylake-S处理器应该在这个功耗档位;其次是普通四核心和双核心产品,分别有65W和35W两个不同的规格。

后来看看大家为关心的内存支持。Skylake-S的桌面版同时支持DDR4内存和DDR3L,并不支持传统的DDR3内存。这是因为DDR4内存的电压为1.2V,DDR3L的内存电压为1.35V,DDR3的内存电压为1.5V,英特尔可能考虑到相关供电的设计问题,因此没有支持DDR3,仅仅支持了和DDR4电压接近的DDR3L。

实际上对用户来说,除了OEM厂商能够大规模的使用DDR3L内存外,一般用户在市场上是基本买不到DDR3L内存的成品内存条的。因此,Skylake支持DDR3L和DDR4一是为OEM厂商考虑,方便OEM厂商在DDR3L和DDR4之间选择搭配。二是在推广DDR4内存的过程中留下缓冲期,让用户不至于被昂贵的DDR4内存所吓倒。如此一来,内存厂商在未来可能会上市多款针对桌面平台的DDR3L内存供消费者选择。

除了上述内容外,Skylake还有一些增强和改进的技术特性,比如英特尔存储保护技术、英特尔时钟同步技术等一些有关商务和安全的特性,和一般用户关系都不大,因此不再赘述。

100系列芯片组:Skylake的佳搭档

英特尔和Skylake系列处理器同时推出的还有100系列芯片组。在普通民用市场上,100系列芯片组分为Z170、H170和H110三款,商务市场上则有Q170、Q150和H150三款。和之前我们介绍的X99一样,100系列芯片组也是事实上的南桥芯片,正如右表中列出的,不同档次的产品有不同的外接设备能力。

在功能上面,100系列芯片组已经开始全面进化到PCI-E 3.0了,同时南桥与CPU相连的DMI通道也进化到DMI 3.0。DMI 3.0相比之前的DMI 2.0,双向传输带宽高达8GB/s,恰好满足了南桥所提供的四个PCI-E 3.0通道的需求。南桥的PCI-E 3.0加上CPU的PCI-E 3.0,使得100系列主板搭配CPU真正实现了主板的全PCI-E 3.0化。这样一来,厂商可以直接使用南桥的PCI-E 3.0通道来设计高速存储接口,不用再担心之前X99、Z97芯片组上可能会出现的带宽不足的问题,也不再需要占用CPU的PCI-E 3.0通道。需要注意的是,100系列芯片组中,面向民用市场的只有Z170和H170支持PCI-E 3.0,低端的H110只支持PCI-E 2.0。

芯片功能上,Z170支持组建多卡或者双卡系统,将CPU提供的20个PCI-E通道拆分为两个PCI-E x8通道或者一个PCI-E x8通道搭配2个PCI-E x4通道。H170和H110不支持多卡功能,这一点和目前的产品定位基本相同。

英特尔全新100系列芯片组架构图。
英特尔全新100系列芯片组架构图。

DDR4普及还需要时间

正如本文开头所说,在经历了长达7年的发展后,DDR3内存终于要走到了终点。当然,在未来三年甚至五年的时间中,DDR3内存都将会活跃在市场上,不过随着主流平台全面向DDR4迁移,DDR3被人遗忘也只是时间问题了。

DDR4的换代意味着什么?在目前PC市场如此乏力的情况下,DDR4的换代,很可能就这样平静过去,不会带来太多的市场变化,人们更乐意将其看做PC市场中一次正常的技术进步而已。对用户来说,DDR4在短期内只是高端玩家的玩物,至少从2015年第二季度Skylake上市后,DDR4普及才真正开始。而全面替代DDR3,可能需要等到2016年才能看到。那时,英特尔和AMD甚至已经又更新过一轮或者两轮产品了。

分享到:

用户评论

用户名:

密码: