GeForce GTX 590仍然采用的是Fermi架构,代号为GF110,并全面继承了GeForce GTX 580以及早的GeForce GTX 480的所有特色。在此,我们不对Fermi架构进行过多分析,我们只将重要的部分简单总结出来,更多的内容请参考本刊2010年4月下和12月上分别对GeForce GTX 480和GeForce GTX 580的详尽评测(以下对Fermi架构的分析也适用于GeForce GTX 480/580)。
强大的多形体引擎
Fermi的多形体引擎是目前GPU设计中强大、能够执行为复杂的曲面细分单元。它的每个SM都配备了一个多形体引擎,总计拥有16个多形体引擎。
改进的CUDA核心
Fermi的CUDA核心拥有完全流水线化的整数算术逻辑单元和浮点算术逻辑单元,完整支持IEEE754-2008浮点标准。另外,Fermi架构能够对32个位置一组的并行线程进行自由调度,这样设计会极大提升显卡的内部效率,让实测性能大大接近理论性能值。
出众的缓存设计
Fermi的核心中首次引入了自由读写的高速缓存,可以用于存储通用计算中产生的临时数据。Fermi为每个SM配备的64kB的片上缓存可以被共享为16kB的一级高速缓存搭配48kB的共享缓存,或者反过来成为48kB的一级高速缓存搭配16kB的共享缓存。另外,Fermi拥有一个容量达768kB的二级高速缓存,可以为所有的载入、存储以及数据请求提供服务。灵活自由的缓存设计大大提高了Fermi在图形计算、通用计算中的效能。
效率更高的ROP单元
Fermi架构中引入了新设计的ROP单元,大幅度增强了抗锯齿效能。另外,Fermi特别提升了原子指令的性能,相同地址的原子操作速度达到了GT200的20倍以上。特别重要的一点是,Fermi架构可以支持32倍的CSAA抗锯齿,这是目前效果好的抗锯齿之一。GeForce GTX 590除了上述重要的3D技术改进之外,还有一些其他的功能设计,但由于和GF110、GF100完全相同,因此我们不再赘述。总体而言,GeForce GTX 590和GeForce GTX 580以及GeForce GTX 480一样,是一款集大成的产品,不仅在传统游戏性能方面有突出的表现,在高性能计算方面相对过去的产品更是有革命性的提升。
另外,和所有的双芯显卡一样,GeForce GTX 590也采用了一颗并联芯片完成两个核心之间的信息传递和交替运作。这颗芯片我们已经相当熟悉了,从GeForce 9800 GX2开始,NVIDIA就采用它作为双卡互联的桥梁,甚至在主板上也常常看到它的身影。没错,就是NF200。NF200能够实现双卡各自PCI-E x16的连接速度,然后以PCI-E x16的速度进行外部连接。可以预见的是,在PCI-E 3.0到来之前,NF200还将继续存在下去。