sp单元800个SP单元直接影响处理能力,因为SP单元是显卡的核心,也可称作大脑。SP单元个数越多则处理能力越强,一般成正比关系,但这仅限于NVIDIA自家的核心或者AMD自家的核心比较范畴。NVIDIA和AMD的SP单元比较可采取近似比较,即NVIDIA的1个SP单元相当于AMD的4个SP单元(随着发展可能会有所不同)。[1]
流处理器直接将多媒体的图形数据流映射到流处理器上进行处理,有可编程和不可编程两种。世面上年公布的名为Cheops中的流处理器,是针对某一个特定的视频处理功能而设计的一种不可编程的流处理器。但为了得到一定的灵活性,系统中也包含一个通用的可编程处理器。从1996年到2001年,MIT和Standford针对图像处理的应用,研制了名为Imagine的可编程流处理器。Imagine流处理器没有采用Cache,而是采用一个SRF(Stream Register File,流寄存器文件),作为流(主)存储器与处理器寄存器之间的缓冲存储器,来解决存储器带宽问题的。流存储器与SRF之间的带宽是2GB/s,SRF与处理器寄存器之间的带宽是32GB/s,ALU Cluster(ALU簇)内寄存器与ALU之间的带宽是544GB/s,三种带宽的比例关系为1:16:272。
严谨些来说N卡的着色单元可称为为流处理器,而A卡的应称之为流处理器单元;两者的差别:N卡流处理器全称为:Stream Processing,而A卡的流处理单元全称为Stream Processing Units。
由于流处理器的频率不同,N卡讲的是高频率的流处理器,靠的是效率。A卡靠的是流处理器数量,频率都比较低,2者等效后,ATI 5个SP=NV1个流处理器。
所以要比的话,ATI显卡的流处理器数量 = N卡流处理器数量 * 5
ATI(AMD)它的这种设计也不能就说效率低下,从系统架构上来说,ATI(AMD)的设计并没有什么问题,它设计的是超标量处理单元,采用4D矢量+1D标量的SIMD架构,而NVIDIA则使用的是1D的标量MIMD架构。不理解没有关系,简单的说,假如要处理的数据能够拆分为4D或1D的方式,那么A卡的所有流处理器都将同时工作,而现实中并不是所有数据都可以拆分为4D和1D的方式,所以A卡的架构在实际运行中必然会有流处理器闲置的情况。从而影响性能,为了弥补流处理器闲置造成的性能损失,ATI(AMD)的做法是依靠提高流处理器数量来弥补。