日本的专栏作家后藤弘茂近展示了一份有关DDR4内存未来发展规格、性能的相当详细的资料。根据他给出的规格图片,我们可以看到整个内存发展中的物理频率、标称频率以及时钟周期等详细数据。我们将详细为大家解释这张图片中体现出的问题。
图2
图2中左侧坐标代表内存颗粒运行的物理频率,物理频率是指内存芯片实际运行的频率。比如DDR 400、DDR2 800、DDR3 1600和DDR4 3200的物理运行频率都是200MHz。右侧的坐标代表了内存的时钟周期(时钟周期和内存物理频率互为倒数),比如DDR 333、DDR2 667、DDR3 1333和DDR4 2666的时钟周期都在6.5~6ns之间。
另外,图中所有的内存名称都属于常见的标称频率,也称名义频率。标称频率是以老旧的SDRAM内存为基准,换算得出利于商业运作和产品标识的频率,比如DDR3 1333,它的带宽和PC 1333(如果有)相同,因此即使它的实际物理频率为166MHz,习惯命名也称为DDR3 1333。
看懂了图2,我们就能继续分析DDR4的规格了。DDR4如果要继续在物理频率不增加的情况下达到高传输性能,只有两种方法。其一就是增加预取位到16bit;其二就是采用多总线技术。GDDR5显存就使用了双总线技术来达到极高的内存带宽和标称频率。比如GDDR5 5000显存,由于采用双总线技术,我们可以将其看作两颗“GDDR5 2500”并行运行,每颗“GDDR5 2500”预取位数为8bit,两颗组成的“双通道”,预取位数可以看作16bit。这样一来,通过总线的增加带来的变相“内存内部双通道”技术,就完成了标称频率的提升。
由于目前JEDEC尚未彻底完成DDR4的规范制定,因此我们不清楚未来DDR4到底采用什么技术来提高标称频率。但有一点毫无疑问,那就是无论是双总线技术还是增大预取值,DDR4内存的物理频率范围依旧会在100MHz~270MHz内波动,终DDR4内存也将面临前代产品存在的高带宽、高延迟等问题。
从图2给出的参数来看,DDR4 1600在桌面上的应用范围应该不太大。这类产品主要依靠更新的工艺和更低的电压达到降低功耗的目的,应用在对功耗、发热量敏感的移动产品上。DDR4内存在桌面平台的应用应该从DDR4 2133开始,主流内存规格是DDR4 2666和DDR4 3200(类似今天的DDR3 1333和DDR3 1600)。至于更高端的DDR4 4266和DDR4 3733,则应该是超频玩家喜欢的搭档。
由于标称频率大幅度上升,DDR4内存终将会拥有相当不错的带宽表现。即使使用主流的DDR4 2666组成双通道128bit内存,带宽也将达到42GB/s左右,一些极限玩家甚至有幸体验到四通道(256bit)DDR4 4266内存规格,位宽则进一步上升到了136GB/s左右,这是一个相当惊人的数字。
图2中的信息相当丰富,有心的读者可以发现更多的问题,比如相同的标称频率,如DDR2 400和DDR 400的时钟周期就相差很大。DDR2 400的时钟周期为10ns左右,相比之下DDR 400只有5ns。那么为什么标称频率相同(意味着带宽相同),但时钟周期却相差如此之多呢?对于这个问题,我们得分两方面来看。
首先,标称频率的增加,是由数据预取技术带来的。比如DDR3内存属于8bit数据预取,也就是说每一次数据传输,它能传输8bit的数据。相比之下,DDR2内存是4bit数据预取,每一次数据传输,它只能传输4bit数据。因此物理运行频率同为100MHz的芯片,DDR2内存的标称频率只有DDR2 400,而DDR3就可以标称至DDR3 800。
虽然表面上看起来DDR3 800和DDR2 800能为系统提供的带宽是一样的,但带宽相同并不代表数据传输能力一样。这就好比同为双向六车道的两条马路,一条限速30km/s,一条限速100km/s,显然后者的运输能力更强。因此这就要说到第二个问题,那就是时钟周期。
所谓时钟周期,代表了完成一次传输需要的时间,这个参数和物理运行频率是直接相关的。我们以DDR2 800和DDR3 800为例,由于这两个产品的物理运行频率相差太远,DDR2 800为200MHz、DDR3 800为100MHz,因此DDR2 800完成一次传输需要5ns(1s/200MHz)、DDR3 800需要10ns(1s/100MHz),DDR3 800的性能比DDR2 800差很多的。