俗话说“好事成双”,现如今显卡领域也通过多卡协作的思路纷纷推出了相关技术,例如AMD-ATI的CrossFireX和NVIDIA的SLI等。这种多卡协作技术主要是为用户提供更具性价比的升级方案,和满足一些顶级硬件、游戏发烧友对极限性能的追求。
NVIDIA的SLI
今天,来到我们中关村在线评测室的显卡是翔升的GTS450金刚版,该款产品以超频为主打,在不改变显卡的情况下,即可让GPU核心频率轻松接近甚至达到1GHz!并且由两块翔升GTS450金刚版显卡组建的SLI交火系统在默认频率下即可轻松虐杀高端A卡HD5870,同时性价比更显优势。那么这款产品究竟有什么过人之处?下面就让我们一一为大家揭秘。
翔升GTS450 金刚版 1G D5
翔升GTS450 金刚版 魅力登场
作为NVIDIA中国区首家AIC显卡品牌和一线老牌板卡厂商,翔升旗下的Fermi架构GTS450产品是首先到货卖场的,同时翔升提供了大量的货源来保证用户购买。同时这款显卡使用了非公版设计,做工豪华、用料十足,在长期使用方面给用户提供了稳定的保障。
千元以下神卡GTS450简析 千元以下神卡GTS450简析
作为G80架构的改良产品G92可以说是一款长寿卡,从2007年末诞生的GeForce 8800 GT一路走来历经不同“朝代”,即使是DirectX 11 API发布1年后的今天,市场中仍能见到由其衍生出来的GeForce GTS 250活跃在零售市场中。 不过好产品归好产品、经典归经典,毕竟G92的性能及功能已经不能再完全满足用户的日常所需,最重要的一点就是DirectX 11 API的不支持。当然在这其中也有很多NVIDIA自身策略原因影响左右,例如DirectX 11产品开发的进度,例如Fermi架构衍生产品的市场定位等等。 公版GeForce GTS 450显卡
从外观而言,GeForce GTS 450与GeForce GTX 460极为相似,均采用了100%覆盖的导风罩设计,同时散热器风扇中置。接口方面公版的GeForce GTS 450采用了双DVI搭配Mini HDMI的组合,和其他所有NVIDIA 4系列DirectX 11产品一致。
PCB正反特写
在NVIDIA上一代产品中,不得不说GeFoce GTX 260和GeForce GTS 250是两款明星产品,他们分别依附在千元价位上,前者主攻千元稍高的价位,而后者主要镇守千元以下高性能产品的地位。同时前者也是GTX高端系列的最“弱”型号,而后者也是中端系列GTS中的最“强”型号,二者给消费者以高性价比的性能体验,深受用户青睐出货量惊人。
时至今日,随着DirectX 11朝代的来临GeForce GTX 260和GeForce GTS 250已经廉颇老矣显现疲态,此时GeForce GTX 460和今日发布的GeForce GTS 450正式走上历史舞台。而且值得一提的是,无论是价位、定位还是命名上,我们都能看到当年GeForce GTX 260和GeForce GTS 250的身影。
PCB正面布线设计
基于40nm工艺制造的GF106-250-KA-A1核心
基于40nm工艺制造的GF106-250-KB-A1核心
标配8颗SAMSUNG K4G10325FE-HC05颗粒 为GeForce GTS 450设计的GF106核心基于40nm工艺打造,型号为GF106-250-KA-A1核心,其由11.7亿个晶体管组成,约为GF106核心的一半。GF106-250核心原生192个流处理器、标配128bit显存控制器,同时具备16个光栅单元和32个纹理单元。
GeForce GTS 450公版产品标配了8颗SAMSUNG K4G10325FE-HC05颗粒,每颗规格为32M*32bit,构成128bit/1024MB的显存规格组合。
千元以下神卡GTS450架构沿革 千元以下神卡GTS450架构沿革
GF100、GF104和GF106都是基于Fermi架构打造,不过在规格矩阵上为了适应不同成本、定位的产品,进行了合理化的调整。例如GF100拥有超过30亿的晶体管、原生具备512个流处理器,而GF104拥有接近20亿的晶体管、原生384个流处理器。
而GF106核心具备11.7亿晶体管、192个流处理器、128bit显存控制器,这些规格细心的用户能够发现正好是GF104的一半,难道二者有着相对更加紧密的关系?
GF100/GF104/GF106市场定位
根据NVIDIA针对GF100、GF104和GF106的定位为除了一个较为形象的比喻,GF100拥有最猛火力的重装战士,而GF104是具备杀伤力武器的机动战士。而GF106被定义为“Sniper”(狙击手),拥有一击毙命的本事,足见NVIDIA对这款产品的厚望。
GF100和GF104核心架构图
GF106核心架构图
通过上面GF100、GF104和GF106的核心架构图,我们发现虽然在整体架构上三者保持了Fermi的完整性,例如GPC→SM→CUDA Core由广到微的等级结构,例如独立的Polymorph Engine和Raster Engine的设计等。
而且从GF104和GF106架构图中不难看出,就GPC、SM、CUDA Cores、MC控制器而言,GF106正好均为GF104的一半。
GF100 SM vs. GF104/GF106 SM |
Graphics Core | Graphics Core | GF100 | GF104/GF106 |
SM | CUDA Cores | 32 | 48 |
Warp Scheduler | 2 | 2 |
Dispatch Unit | 2 | 4 |
SFU | 4 | 8 |
LD/ST | 16 个 | 16 个 |
INT Unit | 32 | 48 |
FP Unit | FP32:32 FP64:16 | FP32:48 FP64:24 |
Texture Unit | 4 | 8 |
不过在微架构上,例如SM的CUDA Core等功能模块的组成,GF106延续了GF104的设计,即每组SM中包含48个CUDA Core、8个SFU和8个纹理单元等改良设计。相比拥有庞大规格的GF100而言,GF104的微架构的优化能够弥补先天规格不足的弊端,所以GF106传承了GF104微架构体系设计。
相 关 显 卡 规 格 对 比 |
显卡型号 | GeForce GTX 480 | GeForce GTX 460 | GeForce GTS 450 | GeForce GTS 250 | Radeon HD 5770 | Radeon HD 5830 | Radeon HD 5870 |
市场定价 | 3500元 | 1499元 | 129美元 | 799 元 | 899 元 | 1499元 | 2999元 |
GPU代号 | GF100 | GF104 | GF106 | G92 | RV840 | RV870 | RV870 |
GPU工艺 | 40nm | 40 nm | 40 nm | 40 nm | 40 nm | 40 nm | 40 nm |
GPU晶体管 | 32亿 | 19.5 亿 | 11.7 亿 | 19.5 亿 | 10.4 亿 | 21.5亿 | 21.5亿 |
着色器数量 | 480 | 336 | 192 | 128 | 800 | 1120 | 1600 |
着色器组织 | 1D*480 | 1D *336 | 1D *192 | 1D *128 | (1D+4D)*160 | (1D+4D)*224 | 1D+4D)*320 |
ROPs数量 | 48 | 32 | 16 | 16 | 16 | 16 | 32 |
纹理单元数量 | 60 | 56 | 32 | 64 | 40 | 56 | 80 |
核心频率 | 700 MHz | 675 MHz | 783 MHz | 738 MHz | 850 MHz | 800 MHz | 850 MHz |
着色器频率 | 1401 MHz | 1350 MHz | 1566 MHz | 1836 MHz | 850 MHz | 800 MHz | 850 MHz |
理论计算能力 | 2.02 TFLOPs | 1.36 TFLOPs | 0.902 TFLOPs | 0.705 TFLOPs | 1.36 TFLOPs | 1.79 TFLOPs | 2.72 TFLOPs |
等效内存频率 | 3696 MHz | 3600 MHz | 3600 MHz | 2200 MHz | 4800 MHz | 4000 MHz | 4800 MHz |
内存位宽 | 384 bit | 256 bit | 128 bit | 256 bit | 128 bit | 256 bit | 256 bit |
内存带宽 | 177.4 GB/s | 115.2 GB/s | 57.6 GB/s | 70.4 GB/s | 76.8 GB/s | 128.0 GB/s | 153.6GB/s |
内存类型 | GDDR5 | GDDR5 | GDDR5 | GDDR3 | GDDR5 | GDDR5 | GDDR5 |
内存容量 | 1024 MB | 1024 MB | 1024 MB | 1024 MB | 1024 MB | 1024 MB | 1024 MB |
DX版本支持 | 11 | 11 | 11 | 10 | 11 | 11 | 11 |
HD视频技术 | PureVideo HD | PureVideo HD | PureVideo HD | PureVideo HD | UVD2 | UVD2 | UVD2 |
通用计算接口 | CUDA | CUDA | CUDA | CUDA | Stream | Stream | Stream |
翔升GTS450金刚做工赏析 翔升GTS450金刚做工赏析
翔升GTS450金刚版1G D5使用的是GF106显示核心,拥有192个流处理器,显卡支持最新的DirectX 11与Shader Model 5.0特效,完美支持CUDA、PhysX物理加速、3D立体显示以及PureVideo高清硬件加速技术。
翔升GTS450金刚概览
翔升GTS450金刚版1G D5区别于公版产品的最大特点在于显卡默认的核心/显存频率为875/4000MHz,大幅超越公版,更高的默认频率可为玩家带来更强悍的游戏性能。
显卡PCB正面大图
搭载强劲显示核心GF106-250-KA-A1
翔升GTS450金刚版1G D5显卡由于采用比公版多一相的5相核心/显存分离式供电设计,单相供电电路需负载的电流更小,相关电子元器件工作温度更低,显卡超频性能更稳定,更具耐久性。
显卡供电设计
且显卡的五相供电电路上全部配备日系高品质LF全固态电容及全封闭式镍芯电感,豪华扎实的用料是显卡长期稳定运行的保证。
0.5ns极速GDDR5显存
翔升GTS450金刚版1G D5的显存规格为1G/128bit,海量显存十分适合大屏高清游戏或视频需求。显卡配备的显存为0.5ns极速GDDR5显存,显存容量高达1GB,十分适合《星际争霸2》、《魔兽世界》等大地图、多建筑物场景的游戏。
散热器与接口设计全解析 散热器与接口设计全解析
翔升GTS450金刚版1G D5显卡配备了少见的酷冷至尊双热管双滚珠风扇,双滚珠风扇的使用寿命高达50000小时,具备耐高温不怕灰尘的特性,特别适合在恶劣的使用环境下运行,是网吧用户和超频玩家的不错选择。
翔升GTS450金刚版1G D5显卡暴力大拆解
该显卡采用的散热更好的8mm加粗金属热管,使用的散热效能极高的F.I.N穿钉技术。散热热管除采用H.D.T工艺,热管与GPU直接接触,具备更强的热传导效率外,热管还进行了镀镍防氧化处理,使用更为耐久。
散热器热管部分特写
6PIN显卡供电接口
显卡输出接口
显卡接口方面采用了DVI+HDMI+VGA的全接口设计,不过由于HDMI和DVI接口过于靠近,因此实际使用当中HDMI接口会与DVI接口发生冲突,造成两者无法同时使用的尴尬,希望翔升在今后的产品当中注意改进。
翔升GTS450金刚版基本信息 翔升GTS450金刚版基本信息
在这个环节,我们使用了常用的GPU-Z软件和EVEREST系统信息检测软件来测试这款显卡的基本信息。
翔升GTS450金刚版显卡 GPU-Z信息
在GPU-Z信息测试中,软件识别出了这款产品的基本情况,我们可以看到它使用了集成192个流处理器的GF106核心,40nm工艺。这款显卡的频率和高频中国版的875MHz设定相同,核心与Shader比为1:2,着色器频率达到1750MHz。
在GPU通用计算能力方面GPU-Z也做了功能识别,GF106图形核心支持GPU-Z软件能够识别的所有功能,OpenCL、CUDA、PhysX和DirectCompute 5.0。
显存方面,受益于DDR5的高预取位带来的高频率,加之GTS450使用的128位显存控制器,最终显存带宽达到了60.2GB/s,当然我们看到显存向上提升的空间还很大,同时128位显存控制器可以最大限度节省晶体管使用量,这符合GF106芯片的市场定位。
翔升GTS450金刚版显卡 GPU-Z传感器信息
在传感器页面,我们看到了这款显卡的传感器能够准确识别显卡的工作状态,没有一个参数错误或者遗漏,特别是GPU温度侦测比较全面。我们用Furmark做了一个简单的3D负载,发现传感器对于温度的检测非常准确,GPU核心也支持频率自适应变化以降低功耗,风扇转速同样随温度变化。其强大的频率控制能力让核心频率最低能下探到50MHz,这可以更大程度上降低芯片功耗。
翔升GTS450金刚版显卡 EVEREST信息
上图是EVEREST检测结果,我们首先选择“图形处理器”,但是由于软件版本限制没有检测到可用信息。我们换用“GPGPU”页面,得到了这款核心的通用计算能力。它的Warp粒度为每个Warp拥有32个线程。
当然对于32位和64位原子操作,GTS450都是支持的。同时值得注意的还有从GT200架构开始支持的双精度能力和Warp Vote功能。这些特性使得Fermi架构的计算性能获得前所未有的提升。在低端产品中同样提供双精度支持,是本次Fermi架构带给用户的重要特性。
翔升GTS450金刚版着色器与温度 翔升GTS450金刚版着色器与温度
我们使用了SiSoftware Sandra 2010版软件来检测这款显卡所搭载的GPU理论浮点吞吐量。这个测试可以检测GPU的Shader单元运算能力,虽然它是面向通用计算程序设计的,但是在一些较为高端的对Shader负载较重的游戏中,Shader单元运算能力强的显卡可以有更强劲的发挥和更小的性能衰减。
需要注意的是这里检测的仅是理论浮点值,实际运算环境中将会包含大量跳转嵌套分支等指令,只有运算器组织得当的GPU,才能有效避免理论值的大幅度衰减。测试对N卡和A卡都默认基于Open CL编程接口,同时测试者可以自行选择编程接口,所以测试结果无论是对于NVIDIA还是AMD都比较公正。
我们使用的版本号是16.36.2010,测试方法是进入程序后,选择界面中的Benchmark工具,然后选择GPGPU Processing项目。
翔升GTS450金刚版显卡 SiSoftware Sandra GPGPU检测
在所列出的几个对比测试中,我们看到翔升GTS450金刚版显卡继承了Fermi架构的全部特性,特别是在理论值上完全放弃FLOPS,转向更深层次的架构优化设计。所以我们在理论值测试中看到它没有什么特别的表现,而未来我们将测试实际运算能力,翔升GTS450金刚版显卡将体现出大幅超越前代产品的态势。我们可以通过图表读出翔升GTS450金刚版显卡单精度能力高于其他四款显卡,而双精度能力低于GTX260。
这个测试图表的横轴是单精度Shader型浮点,而纵轴是双精度Shader型浮点,我们能够看到双敏GTS450金牛版显卡单精度浮点性能符合Geforce类型的桌面型产品,而目前在Fermi架构GF100芯片中只有高性能计算级别的Tesla专用加速卡才拥有业界顶级的双精度运算能力,民用的GF106产品在双精度能力上做了限制。
在正式图形性能测试开始之前我们对翔升GTS450金刚版显卡的稳定性也做了测试,使用的软件是大家公认的也是常用的Furmark,版本号1.8.0。
翔升GTS450金刚版显卡 稳定性与温度测试
FurMark是oZone3D开发的一款OpenGL基准测试工具,通过皮毛渲染算法来衡量显卡的性能,同时还能借此考验显卡的稳定性。
通过测试我们看到翔升GTS450金刚版显卡凭借所搭载的酷冷至尊双热管双滚珠风扇发挥出了非常强的性能。测试起始温度38度,满载运行了将近7分钟后的显卡最高温度没有超过67度,表现相当出色
[ 此帖被3331在2010-11-18 15:38重新编辑 ]