NV首度冲击千元以下DX11市场 北京时间2010年9月13日12时,NVIDIA针对主流千元级DirectX 11
显卡全球发布新品,其型号为GeForce GTS 450。它的出现创造了很多NVIDIA的第一,例如第一款定价在千元以下的DirectX 11显卡,例如它是NVIDIA一款支持DirectX 11中缀为GTS的显卡。
如果你现在升级显卡或者装电脑,一款不支持DirectX 11 API的产品你会选择吗?我想,99.99%的用户都会用户答案都会是选择支持DirectX 11 API的产品。但由于主流人群的消费欲望而言,虽然中高端产品性能强劲,但无奈价格因素让大多数消费者望而却步。同时,在今天之前NVIDIA千元以下并无DirectX 11产品,所以量大、用户群众多的大半壁DirectX 11江山被竞争对手AMD轻松夺取。 NVIDIA相比AMD发布第一款DirectX 11产品晚了将近半年,而在千元以下DirectX 11产品则更是相比AMD晚了将近一年。不过迟到总比不到好,GeForce GTS 450的出现让我们拭目以待。 NVIDIA从上一代产品开始采用了新的型号命名方式,即前缀固定为GeForce,后缀为三位数字,数值越大代表产品性能越强。同时,NVIDIA为了让用户更加一目了然的知道产品定位,还引入了中缀感念,中缀分别有GTX、GTS、GT和空,产品定位及性能依次降低。而GeForce GTS 450顾名思义,是一款中端定位产品,同时450表示相比其他以发布产品来说性能都弱,当然弱的概念是截至今日,未来NVIDIA还会发布相比GeForce GTS 450定位、性能更低端的400系列产品。 GeForce GTS 450使用了原生的GF106核心,它并非早期Fermi架构的GF100和GF104缩减规格而来,同时得益于Fermi架构的设计,其在计算效率及能力上相比前代同价位产品有了长足进步。由于NVIDIA为GeForce GTS 450定价129美元起,所以根据折算后的人民币价格能够看出,其主要对位Radeon HD 5700系列。市 售 顶 级 显 卡 规 格 比 较 表 |
显卡型号 | GeForce GTX 460 | GeForce GTX 460 | GeForce GTS 450 | GeForce GTS 450 | GeForce GTS 250 | Radeon HD 5770 | Radeon HD 5750 |
市场定价 | 1499 元 | 1299 元 | 129美元 | 129美元 | 799 元 | 999 元 | 799 元 |
GPU代号 | GF104 | GF104 | GF106 | GF106 | G92 | RV840 | RV840 |
GPU工艺 | 40 nm | 40 nm | 40 nm | 40 nm | 40 nm | 40 nm | 40 nm |
GPU晶体管 | 19.5 亿 | 19.5 亿 | 11.7 亿 | 11.7 亿 | 19.5 亿 | 10.4 亿 | 10.4 亿 |
着色器数量 | 336 | 336 | 192 | 192 | 128 | 800 | 720 |
着色器组织 | 1D *336 | 1D *336 | 1D *192 | 1D *192 | 1D *128 | (1D+4D)*160 | (1D+4D)*144 |
ROPs数量 | 32 | 24 | 16 | 16 | 16 | 16 | 16 |
纹理单元数量 | 56 | 56 | 32 | 32 | 64 | 40 | 36 |
核心频率 | 675 MHz | 675 MHz | 875 MHz | 783 MHz | 738 MHz | 850 MHz | 725 MHz |
着色器频率 | 1350 MHz | 1350 MHz | 1750 MHz | 1566 MHz | 1836 MHz | 850 MHz | 725 MHz |
理论计算能力 | 1.36 TFLOPs | 1.36 TFLOPs | 1.008 TFLOPs | 0.902 TFLOPs | 0.705 TFLOPs | 1.36 TFLOPs | 1.008 TFLOPs |
等效内存频率 | 3600 MHz | 3600 MHz | 4000 MHz | 3600 MHz | 2200 MHz | 4800 MHz | 4000 MHz |
内存位宽 | 256 bit | 192bit | 128 bit | 128 bit | 256 bit | 128 bit | 128 bit |
内存带宽 | 115.2 GB/s | 86.4 GB/s | 64 GB/s | 57.6 GB/s | 70.4 GB/s | 76.8 GB/s | 73.6 GB/s |
内存类型 | GDDR5 | GDDR5 | GDDR5 | GDDR5 | GDDR3 | GDDR5 | GDDR5 |
内存容量 | 1024 MB | 768 MB | 1024 MB | 1024 MB | 1024 MB | 1024 MB | 1024 MB |
DX版本支持 | 11 | 11 | 11 | 11 | 10 | 11 | 11 |
HD视频技术 | PureVideo HD | PureVideo HD | PureVideo HD | PureVideo HD | PureVideo HD | UVD2 | UVD2 |
通用计算接口 | CUDA | CUDA | CUDA | CUDA | CUDA | Stream | Stream |
通过上表我们能够看到,有关GeForce GTS 450产品规格有两列,细心的读者能够看出中的不同主要集中在频率上,而在硬件规格上并无区别,这是为什么呢? 经过笔者了解,GeForce GTS 450这款产品是NVIDIA为主流消费者量身定做的高性能“作品”,其不仅对各品牌商开放PCB设计还对频率没有做硬性设置,根据各品牌自己的销售策略定制。同时NVIDIA针对中国这个特殊的市场专门将GeForce GTS 450默认频率提升至875MHz/1750MHz/4000MHz,而国外的公版频率为783MHz/1566MHz/3600MHz。 自然频率的提升会带来大幅的性能提升,不过在价格方面并没有因此而变化,不得不说NVIDIA为广大中国消费者提供了相比国外更具性价比的产品。不过据笔者估计,在GeForce GTS 450国内上市初期肯定还是会有783MHz/1566MHz/3600MHz的产品的出现,同时NVIDIA针对品牌商开放性频率设定政策,想必9月13日以后市场中会出现诸多版本频率的GeForce GTS 450。不过考虑到GF104的超频能力,想必GF106的超频能力也不会差,所以高频、低频就仁者见仁智者见智了。产品:
双敏 无极2 GTS450 DDR5大牛版 显卡 G92接班人 千元悍将GF106诞生G92接班人 千元悍将GF106诞生 作为G80架构的改良产品G92可以说是一款长寿卡,从2007年末诞生的GeForce 8800 GT一路走来历经不同“朝代”,即使是DirectX 11 API发布1年后的今天,市场中仍能见到由其衍生出来的GeForceG GTS 250活跃在零售市场中。 不过好产品归好产品、经典归经典,毕竟G92的性能及功能已经不能再完全满足用户的日常所需,最重要的一点就是DirectX 11 API的不支持。当然在这其中也有很多NVIDIA自身策略原因影响左右,例如DirectX 11产品开发的进度,例如Fermi架构衍生产品的市场定位等等。NVIDIA明星产品的传承
在NVIDIA上一代产品中,不得不说GeFoce GTX 260和GeForce GTS 250是两款明星产品,他们分别依附在千元价位上,前者主攻千元稍高的价位,而后者主要镇守千元以下高性能产品的地位。同时前者也是GTX高端系列的最“弱”型号,而后者也是中端系列GTS中的最“强”型号,二者给消费者以高性价比的性能体验,深受用户青睐出货量惊人。
时至今日,随着DirectX 11朝代的来临GeForce GTX 260和GeForce GTS 250已经廉颇老矣显现疲态,此时GeForce GTX 460和今日发布的GeForce GTS 450正式走上历史舞台。而且值得一提的是,无论是价位、定位还是命名上,我们都能看到当年GeForce GTX 260和GeForce GTS 250的身影。
● 不再大块头 无需保护盖 “我”是GF106
在GeForce GTX 400系列中包含GF100和GF104两种核心,二者的晶体管数量有数十亿以上,所以在核心设计上均设有一块“保护盖”,学名IHS是Integrated Heat Spreader的缩写,中文译为集成散热器。它的主要材质是镀镍的铜制导热模块,在NVIDIA进入2006年底进入DirectX 10时代后,历代顶级核心都配有这个“保护盖”,起到导热、保护核心免受物理损伤的作用。 不过,在GF106上我们没有看到IHS的引入,直接能够零距离基础GF106核心。
基于40nm工艺制造的GF106-250-KA-A1核心
基于40nm工艺制造的GF106-250-KB-A1核心
为GeForce GTS 450设计的GF106核心基于40nm工艺打造,型号为GF106-250-KA-A1核心,其由11.7亿个晶体管组成,约为GF106核心的一半。GF106-250核心原生192个流处理器、标配128bit显存控制器,同时具备16个光栅单元和32个纹理单元。由于Fermi架构加入了GPU、PolyMorph Engine和Raster Engine等概念,GF106核心包含1组GPC、4组SM、4组PolyMorph Engine和1组Raster Engine,有关GF106核心架构分析,我们会在下一章节做浅析。
GF106核心呈正方形 边长约为15.25mm
正如前文所提及,由于GF106不再是基于庞大的晶体管群(相比GF100/104核心而言),所以无需IHS这才得以我们更加直观的了解核心大小。通过游标卡尺测量边长约为15.25mm,核心面积约为233mm2。由于NVIDIA目前还没给出GF106 Die Size数值,我们无法得知测量误差大小。
针对中国市场定制的公版875MHz/1750MHz/4000MHz频率
GeForce GTS 450国际频率设定为783MHz/1566MHz/3600MHz
GeForce GTS 450共有两个频率版本,其中NVIDIA针对全球公版设定的频率为783MHz/1566MHz/3600MHz,而同时NVIDIA(中国)针对中国特有的市场设定了一款高频GeForce GTS 450主攻中国市场,其频率高达875MHz/1750MHz/4000MHz,足以证明NVIDIA对中国市场和消费者的忠实,同时也可以看出GF106核心的超频能力十分了得,这样的频率设定是NVIDIA公版产品中设定的最高频率卡。
产品:双敏 无极2 GTS450 DDR5大牛版 显卡 GF106延续Fermi架构 传承GF104体系
GF106延续Fermi架构 传承GF104体系
GF100、GF104和GF106都是基于Fermi架构打造,不过在规格矩阵上为了适应不同成本、定位的产品,进行了合理化的调整。例如GF100拥有超过30亿的晶体管、原生具备512个流处理器,而GF104拥有接近20亿的晶体管、原生384个流处理器。
而GF106核心具备11.7亿晶体管、192个流处理器、128bit显存控制器,这些规格细心的用户能够发现正好是GF104的一半,难道二者有着相对更加紧密的关系?
GF100/GF104/GF106市场定位
根据NVIDIA针对GF100、GF104和GF106的定位为除了一个较为形象的比喻,GF100拥有最猛火力的重装战士,而GF104是具备杀伤力武器的机动战士。而GF106被定义为“Sniper”(狙击手),拥有一击毙命的本事,足见NVIDIA对这款产品的厚望。
GF100和GF104核心架构图
GF106核心架构图
通过上面GF100、GF104和GF106的核心架构图,我们发现虽然在整体架构上三者保持了Fermi的完整性,例如GPC→SM→CUDA Core由广到微的等级结构,例如独立的Polymorph Engine和Raster Engine的设计等。
而且从GF104和GF106架构图中不难看出,就GPC、SM、CUDA Cores、MC控制器而言,GF106正好均为GF104的一半。
GF100 SM vs. GF104/GF106 SM |
Graphics Core | Graphics Core | GF100 | GF104/GF106 |
SM | CUDA Cores | 32 | 48 |
Warp Scheduler | 2 | 2 |
Dispatch Unit | 2 | 4 |
SFU | 4 | 8 |
LD/ST | 16 个 | 16 个 |
INT Unit | 32 | 48 |
FP Unit | FP32:32 FP64:16 | FP32:48 FP64:24 |
Texture Unit | 4 | 8 |
不过在微架构上,例如SM的CUDA Core等功能模块的组成,GF106延续了GF104的设计,即每组SM中包含48个CUDA Core、8个SFU和8个纹理单元等改良设计。相比拥有庞大规格的GF100而言,GF104的微架构的优化能够弥补先天规格不足的弊端,所以GF106传承了GF104微架构体系设计。
● GF106核心SM模块的设计优势
GF106由于传承了GF104的SM微架构设计,原因很简单,从基于GF104核心打造的GeForce GTX 460性能表现就能看出,这种微架构的调整换来了在3D性能上更突出的表现,而GF106产品针对的用户群体更加明确,针对主流消费者用户设计,自然这类占绝对大比例的用户对产品的体验主要集中在3D效能体验,所以有了GF106这样的设计。
当然这样并不是否定GF100核心SM微架构设计的不合理,毕竟GF100针对的用户群体是最高端的,同时还要兼顾通用计算方面的性能,所以才会有了GF100核心SM微架构设计。与其说NVIDIA针对不同用户群设计不同的定位的核心,不如说NVIDIA针对不同用户群设计了不同SM微架构的核心。
GF100 SM架构图
GF104/GF106 SM架构图
GF106的一个SM中现在拥有48个CUDA Core,每个CUDA Core由两个Dispatch Port、Operand Collector、Result Queue以及INT整型数单元与FP浮点数单元构成。其中GF106的ALU和FPU均继承了GF100中CUDA Core的优良特性,例如ALI可以支持64bit精度指令运算,还有比较、布尔和移位等指令计算,值得一提的是Fermi架构的ALU通过改进现已完整支持32bit整数算法。同时FPU支持IEEE 754-2008标准,这一切一切的改变和支持都为Fermi架构在GPU通用计算上打下坚实基础。
当然,在CUDA Core的优化上可以大幅提升GPU运算能力,但是没有良好的缓存设计及读写机制也无法发挥GPU的能力。在GF106的每个SM中与GF100一样,都包含LD/ST Cache、L1 Cache、Uniform Cache和Texture Cache。其中GF106拥有12KB的L1纹理缓存之外,还拥有真正意义的L1 Cache和L2 Cche可读写缓存。就每组SM而言,每组SM拥有8个纹理单元共享12KB的L1纹理缓存,32个CUDA Core使用16KB L1缓存搭配48KB共享缓存或48KB L1缓存搭配16KB共享缓存两种组合,最后还有768KB超大L2缓存。
我们可以看到GF106每个SM中CUDA Core数量和Texture Unit数量均有大幅增加,这都会增加SM的3D计算能力,从而让用户在游戏体验上获得更好的效果。不过相反每个CUDA Core和Texture Unit分得的各类Cache有所减少,这应该是NVIDIA GPU架构工程师针对主流用户使用需求的前提下,在性能、晶体管平衡取舍上得出的最佳比例。
产品:双敏 无极2 GTS450 DDR5大牛版 显卡 高配没商量 GTS450标配1GB GDDR5显存
高配没商量 GTS450标配1GB GDDR5显存
GDDR5已经成为目前主流产品的绝佳搭档,AMD方面除了最低端的Radeon HD 5450之外,其他所有型号都推出了GDDR5版或者Only GDDR5,NVIDIA方面从目前以发布的DirectX 11产品来来看,无一例外的都选择了GDDR5方案。GDDR5的好处不言而喻,高效、高频、高带宽、低电压,这三高一低的特色注定GDDR5将占领当今显卡显存使用的绝对大比例。 我们前文曾提过NVIDIA针对GeForce GTS 450在中国市场设计的更好定位的公版,频率高达875MHz/1750MHz/4000MHz,而全球的公版频率为783MHz/1566MHz/3600MHz。不过无论哪种版本都是128bit/1024MB的组合,与GeForce GTX 460两个版本的设计有区别。
标配8颗SAMSUNG K4G10325FE-HC05颗粒
GeForce GTS 450公版产品标配了8颗SAMSUNG K4G10325FE-HC05颗粒,每颗规格为32M*32bit,构成128bit/1024MB的显存规格组合。
SAMSUNG K4G10325FE-HC05颗粒的理论极限等效频率为4000MHz,也就是说中国公版产品的显存频率已经为该颗粒的极限,不过我们知道理论极限并非颗粒的实际极限,起码还有10%左右的提升,再搭配上GF106的核心超频能力,整个产品还有很大潜力可挖。
显存颗粒布局方式(一)使用GF106-250-KA-A1核心
显存颗粒布局方式(二)使用GF106-250-KB-A1核心
显卡共使用了了8颗PCB,分别位于PCB正反面各四颗。不过细心的用户会发现,在PCB正反两侧各有两个空焊显存位,再加上核心上GF106-250-KA-A1中“KA”的标识,不难让大家联想到GeForce GTX 460 768MB产品。
● GeForce GTS 450显存布局及空焊揭秘
那么GeForce GTS 450也会像GeForce GTX 460 768MB一样留有硬件规格升级空间?
GeForce GTS 450核心及显存位设计
我们可以看到在GeForce GTS 450的产品设计图上,仅有8颗显存设计。同时还可以看到需要6pin外接供电,PCI-Express为2.0版本;在视频信号输出接口上,根据上图了解到可以采用DVI*2+Mini HDMI或DVI + DP + Mini HDMI的组合,不过根据实际送测各品牌样卡了解到,D-Sub接口同样可以加入到组合中;最后SLI MIO桥仅为一个,与GeForce GTX 460一样。
PCB1060显存位设计
NVIDIA为GeForce GTS 450设计的公版PCB版本好为P1060,PCB预留显存焊位12个,正反各6个。
核心型号与显存为之间的关系
通过上图我们能够看到GeForce GTX 460 768MB的痕迹,与其一样,空焊有边4颗显存,对应的核心代号为“KA”,空焊中间4颗为“KB”,以此类推空焊左边4颗就为“KC”。
三种核心型号对应三种显存位
根据上图我们了解到,GF106的显存控制器只能对打开2组控制接口,也就是说KA、KB、KC三个任意二者组合。同时必须为特定的KA、KB、KC位置,不能任意位置空焊4颗显存,与之对应的核心就为GF106-250-KA-A1、GF106-250-KB-A1、GF106-250-KC-A1。
作为NVIDIA在4系列显卡中唯一的第一次发布即为满规格产品,预留的4个显存位有何寓意我们目前不知道,也许在GF106核心里还有很多秘密等待NVIDIA告诉我们,或者我们自己去发现。
产品:双敏 无极2 GTS450 DDR5大牛版 显卡 GTS450神似GTX460 却内有不同乾坤
● GTS450神似GTX460 却内有不同乾坤
前面对GeForce GTS 450的核心、显存及规格进行了大量阐述,下面就让我们对GeForce GTS 450本身进行一个拆解介绍。
公版GeForce GTS 450
显卡 从外观而言,GeForce GTS 450与GeForce GTX 460极为相似,均采用了100%覆盖的导风罩设计,同时散热器风扇中置。接口方面公版的GeForce GTS 450采用了双DVI搭配Mini HDMI的组合,和其他所有NVIDIA 4系列DirectX 11产品一致。 PCB正反特写
PCB正面布线设计
公版PCB版本好为P1060
GeForce GTS 450采用了P1060公版PCB设计,首先一颗GF106镇守PCB中央,周围设有1+3+2的显存位。由于GeForce GTS 450的TDP仅为105瓦,所以PCI-Express Gen2和6pin外接供电足以满足其需求。
核心采用3+1相供电设计
供电模组布线
在供电方面,显卡配备3+1相供电模组,每相供电均采用屏蔽式电感、固态电容和八爪鱼式封装Mosfet。同时显卡TDP为105W,所以需要一个6pin外接供电,最大提供150W的电能输入。
视频接口采用DVI*2 + Mini HDMI组合
显卡视频信号输出接口采用了DVI *2 + Mini HDMI的组合,这样的组合不仅能够满足普通用户的需求,还能满足高清用户的需求。值得一提的是,GeForce GTS 450支持NVIDIA推出3D Surround技术,在双卡SLI模式下实现三屏3D输出。
产品:双敏 无极2 GTS450 DDR5大牛版 显卡 低功耗/低发热 GTS450只需小巧散热器
低功耗/低发热 小巧风扇即可
40nm工艺低功耗、低发热量的能力是不容忽视的,即使拥有11.7亿晶体管的GF106运行在875MHz核心频率下仅需一个纯铝散热模块和8cm静音风扇即可。想想拥有14亿晶体管采用55nm工艺制造的GT200核心,与GF104产品的散热器规模是天壤之别。 公版GeForce GTS 450散热器
散热器背面特写
由于GeForce GTS 450的PCB长度为8.25吋,散热器整个覆盖PCB,不过与GeForceGTX 480不同的是,导风罩为开放式,这与中央风扇设计有关。
完全拆解的GeForce GTS 450
对GeForce GTS 450进行了充分的物理拆解,总共可分为四部分,显卡主体、导风罩、核心散热模块和风扇。 标配的8cm风扇
风扇为AVC生产
风扇采用了AVC设计的11叶8cm产品,型号为DAS0815R2U,电压12V、电流0.6A,这款产品在满载状态下会有大概65分贝噪音,在显卡待机状态下风扇噪音忽略不计,而且值得一提的是,笔者的平台为裸放,如果放到机箱中会更安静。 风扇支持4pin PWM调节
这款AVC的风扇采用4pin供电,支持PWM调速技术,能够在性能、温度、噪音之间合理调配平衡点。
散热器为2010年8月24日生产
核心散热模块采用纯铝材质,通过铝挤技术一次成型。散热模块成太阳花式设计,每支散热鳍分为两岔,增加散热面积。