对于那些初涉DIY硬件的玩家,首先当然要搞清楚CPU、主板、显卡等配件是什么、如何发挥功能。之后,如果还想进一步摆弄自己的硬件,几乎所有玩家都会尝试超频。其中CPU的超频很好理解,提升外频或者倍频后,处理器的工作速度自然会加快。但如果你有一块NVIDIA的DirectX 10显卡,它的频率调节可就不那么单纯了。
GeForce 9500GT的频率设定界面
安装NVIDIA System tools软件后,NVIDIA的显卡控制中心会多出超频项目,其中有三个频率调节滑块,分别是核心时钟、内存时钟和着色器时钟。毫无疑问,将它们的频率调高后显卡的性能也会提升,但许多不想调得不明不白的玩家可能会产生疑问:这三个频率调节滑块分别控制着显卡的哪个部分?它们又是如何影响显卡工作的?要回答这些问题,还得从显卡如何生成3D图像说起。
简单点说,显卡生成3D图像的过程就相当于用三根棍子围成一个三角框,然后剪一张形状相等的纸粘在框上,后在纸框上画上想要的图案。如果想要一个正四面体,可拿四个等边三角形纸框拼起来,如果想要一个正方体,可做12个等腰直角三角形拼起来。例如显卡要绘制出下图中的3D正立方体,首先它需要计算出正立方体8个顶点的空间坐标,然后把顶点每3个一组连接起来生成面,后再把“DirectX”图像贴在面上,并计算出不同角度表现出的光照亮度等视觉效果就完成了。在
GPU中,这三个步骤依次由顶点着色器,几何着色器和像素着色器来负责,它们也是GPU中为重要,处理负荷重的单元。但这种设计会带来一个问题:有些游戏的几何处理任务更重,而有的游戏像素处理任务更重,这就会造成某类着色器空闲,而某类着色器又不够用的情况。
正立方体的结构
为了解决上述问题,新的DirectX 10显卡的着色器架构被重新设计,取而代之的是流处理器(或称统一着色器)—它能同时完成顶点、几何和像素处理任务,可根据任务的比重变化调整分配给不同任务的流处理器数量,这样就充分利用了流处理器资源,让游戏性能佳化。相对于AMD显卡,NVIDIA的设计则更加巧妙,它把流处理器频率从GPU频率中独立出来,让其工作在一个更高的频率下。前文已提到,顶点、几何和像素处理任务是为繁重的,让负责处理它们的流处理器工作在更高的频率下显然能提升显卡的性能,如果进一步进行超频,GPU生成3D图形的速度自然就会加快,对性能的提升非常有意义。
这里谈到的GPU除了流处理器,为重要的部分是ROP、RAMDAC和控制器,前两者的作用仍旧是图像处理,后者是GPU中的指挥中心,显卡各单元都归它管理,协调数据的输入输出,接受并执行来自CPU的命令等。
ROP的中文全称是“光栅操作单元”, GeForce 9500 GT显卡的光栅操作单元有8个ROPs,而GeForce GTX 285这样的高端显卡则有32个。它的工作紧接在流处理器之后,负责将流处理器完成的3D图形数据转换为图像,并进行后期加工。
GeForce GTX 275显卡的物理结构(RAMDAC被独立出来)
流处理器处理完的数据都是诸如空间中哪个坐标处有一个形状是怎样的图形,全都是用数学来描述的数据。例如数学老师让学生在纸上画一个6cm×4cm的红色长方形,学生按照老师的描述画出边并涂上颜色,我们才能真正知道这个长方形看起来是什么样子。其中老师就相当于流处理器,而学生就相当于ROP。如果这个学生不太聪明,画的速度很慢,那老师必须等他画完才能给他出下一道题,显卡也是一个道理。更何况ROP还负责全屏抗锯齿(AA)的处理,如果GPU的频率不高,那么玩游戏时开启AA肯定不会流畅。
RAMDAC的中文全称是“随机数模转换记忆体”,它的工作接在光栅操作单元之后,负责把终图像转换为显示器能够识别的视频信号,比如DVI信号。在NVIDIA的高端显卡中,RAMDAC已从GPU中独立出来,用一枚靠近视频接口的NVIO芯片负责。它的频率也是独立的,比如400MHz,但这个频率高低和游戏性能毫无关系,400MHz已经能足够好地完成任务,没有必要对其进行超频。