主题 : NV首款不减配显卡 千元悍将GTS450首测
Freestyle_
级别: 优秀会员
UID: 13333
精华: 0
发帖: 13055
威望: 39071 点
无痕币: 4499 WHB
贡献值: 6 点
在线时间: 2733(时)
注册时间: 2008-07-21
最后登录: 2024-03-19

0 NV首款不减配显卡 千元悍将GTS450首测

NV首度冲击千元以下DX11市场
  北京时间2010年9月13日12时,NVIDIA针对主流千元级DirectX 11显卡全球发布新品,其型号为GeForce GTS 450。它的出现创造了很多NVIDIA的第一,例如第一款定价在千元以下的DirectX 11显卡,例如它是NVIDIA一款支持DirectX 11中缀为GTS的显卡。
        如果你现在升级显卡或者装电脑,一款不支持DirectX 11 API的产品你会选择吗?我想,99.99%的用户都会用户答案都会是选择支持DirectX 11 API的产品。但由于主流人群的消费欲望而言,虽然中高端产品性能强劲,但无奈价格因素让大多数消费者望而却步。同时,在今天之前NVIDIA千元以下并无DirectX 11产品,所以量大、用户群众多的大半壁DirectX 11江山被竞争对手AMD轻松夺取。
        NVIDIA相比AMD发布第一款DirectX 11产品晚了将近半年,而在千元以下DirectX 11产品则更是相比AMD晚了将近一年。不过迟到总比不到好,GeForce GTS 450的出现让我们拭目以待。

        NVIDIA从上一代产品开始采用了新的型号命名方式,即前缀固定为GeForce,后缀为三位数字,数值越大代表产品性能越强。同时,NVIDIA为了让用户更加一目了然的知道产品定位,还引入了中缀感念,中缀分别有GTX、GTS、GT和空,产品定位及性能依次降低。而GeForce GTS 450顾名思义,是一款中端定位产品,同时450表示相比其他以发布产品来说性能都弱,当然弱的概念是截至今日,未来NVIDIA还会发布相比GeForce GTS 450定位、性能更低端的400系列产品。
        GeForce GTS 450使用了原生的GF106核心,它并非早期Fermi架构的GF100和GF104缩减规格而来,同时得益于Fermi架构的设计,其在计算效率及能力上相比前代同价位产品有了长足进步。由于NVIDIA为GeForce GTS 450定价129美元起,所以根据折算后的人民币价格能够看出,其主要对位Radeon HD 5700系列。
市 售 顶 级 显 卡 规 格 比 较 表
显卡型号GeForce GTX 460GeForce GTX 460GeForce GTS 450GeForce GTS 450GeForce GTS 250Radeon HD 5770Radeon HD 5750
市场定价1499 元1299 元129美元129美元799 元999 元799 元
GPU代号GF104GF104GF106GF106G92RV840RV840
GPU工艺40 nm40 nm40 nm40 nm40 nm40 nm40 nm
GPU晶体管19.5 亿19.5 亿11.7 亿11.7 亿19.5 亿10.4 亿10.4 亿
着色器数量336336192192128800720
着色器组织1D *3361D *3361D *1921D *1921D *128(1D+4D)*160(1D+4D)*144
ROPs数量32241616161616
纹理单元数量56563232644036
核心频率675 MHz675 MHz875 MHz783 MHz738 MHz850 MHz725 MHz
着色器频率1350 MHz1350 MHz1750 MHz1566 MHz1836 MHz850 MHz725 MHz
理论计算能力1.36 TFLOPs1.36 TFLOPs1.008 TFLOPs0.902 TFLOPs0.705
TFLOPs
1.36 TFLOPs1.008 TFLOPs
等效内存频率3600 MHz3600 MHz4000 MHz3600 MHz2200 MHz4800 MHz4000 MHz
内存位宽256 bit192bit128 bit128 bit256 bit128 bit128 bit
内存带宽115.2 GB/s86.4 GB/s64 GB/s57.6 GB/s70.4 GB/s76.8 GB/s73.6 GB/s
内存类型GDDR5GDDR5GDDR5GDDR5GDDR3GDDR5GDDR5
内存容量1024 MB768 MB1024 MB1024 MB1024 MB1024 MB1024 MB
DX版本支持11111111101111
HD视频技术PureVideo HDPureVideo HDPureVideo HDPureVideo HDPureVideo HDUVD2UVD2
通用计算接口CUDACUDACUDACUDACUDAStreamStream

        通过上表我们能够看到,有关GeForce GTS 450产品规格有两列,细心的读者能够看出中的不同主要集中在频率上,而在硬件规格上并无区别,这是为什么呢?
        经过笔者了解,GeForce GTS 450这款产品是NVIDIA为主流消费者量身定做的高性能“作品”,其不仅对各品牌商开放PCB设计还对频率没有做硬性设置,根据各品牌自己的销售策略定制。同时NVIDIA针对中国这个特殊的市场专门将GeForce GTS 450默认频率提升至875MHz/1750MHz/4000MHz,而国外的公版频率为783MHz/1566MHz/3600MHz。
        自然频率的提升会带来大幅的性能提升,不过在价格方面并没有因此而变化,不得不说NVIDIA为广大中国消费者提供了相比国外更具性价比的产品。不过据笔者估计,在GeForce GTS 450国内上市初期肯定还是会有783MHz/1566MHz/3600MHz的产品的出现,同时NVIDIA针对品牌商开放性频率设定政策,想必9月13日以后市场中会出现诸多版本频率的GeForce GTS 450。不过考虑到GF104的超频能力,想必GF106的超频能力也不会差,所以高频、低频就仁者见仁智者见智了。

产品:双敏 无极2 GTS450 DDR5大牛版 显卡 G92接班人 千元悍将GF106诞生

G92接班人 千元悍将GF106诞生
        作为G80架构的改良产品G92可以说是一款长寿卡,从2007年末诞生的GeForce 8800 GT一路走来历经不同“朝代”,即使是DirectX 11 API发布1年后的今天,市场中仍能见到由其衍生出来的GeForceG GTS 250活跃在零售市场中。
        不过好产品归好产品、经典归经典,毕竟G92的性能及功能已经不能再完全满足用户的日常所需,最重要的一点就是DirectX 11 API的不支持。当然在这其中也有很多NVIDIA自身策略原因影响左右,例如DirectX 11产品开发的进度,例如Fermi架构衍生产品的市场定位等等。


NVIDIA明星产品的传承
        在NVIDIA上一代产品中,不得不说GeFoce GTX 260和GeForce GTS 250是两款明星产品,他们分别依附在千元价位上,前者主攻千元稍高的价位,而后者主要镇守千元以下高性能产品的地位。同时前者也是GTX高端系列的最“弱”型号,而后者也是中端系列GTS中的最“强”型号,二者给消费者以高性价比的性能体验,深受用户青睐出货量惊人。
        时至今日,随着DirectX 11朝代的来临GeForce GTX 260和GeForce GTS 250已经廉颇老矣显现疲态,此时GeForce GTX 460和今日发布的GeForce GTS 450正式走上历史舞台。而且值得一提的是,无论是价位、定位还是命名上,我们都能看到当年GeForce GTX 260和GeForce GTS 250的身影。
        ● 不再大块头 无需保护盖 “我”是GF106
        在GeForce GTX 400系列中包含GF100和GF104两种核心,二者的晶体管数量有数十亿以上,所以在核心设计上均设有一块“保护盖”,学名IHS是Integrated Heat Spreader的缩写,中文译为集成散热器。它的主要材质是镀镍的铜制导热模块,在NVIDIA进入2006年底进入DirectX 10时代后,历代顶级核心都配有这个“保护盖”,起到导热、保护核心免受物理损伤的作用。
        不过,在GF106上我们没有看到IHS的引入,直接能够零距离基础GF106核心。

基于40nm工艺制造的GF106-250-KA-A1核心

基于40nm工艺制造的GF106-250-KB-A1核心
        为GeForce GTS 450设计的GF106核心基于40nm工艺打造,型号为GF106-250-KA-A1核心,其由11.7亿个晶体管组成,约为GF106核心的一半。GF106-250核心原生192个流处理器、标配128bit显存控制器,同时具备16个光栅单元和32个纹理单元。由于Fermi架构加入了GPU、PolyMorph Engine和Raster Engine等概念,GF106核心包含1组GPC、4组SM、4组PolyMorph Engine和1组Raster  Engine,有关GF106核心架构分析,我们会在下一章节做浅析。

GF106核心呈正方形 边长约为15.25mm
        正如前文所提及,由于GF106不再是基于庞大的晶体管群(相比GF100/104核心而言),所以无需IHS这才得以我们更加直观的了解核心大小。通过游标卡尺测量边长约为15.25mm,核心面积约为233mm2。由于NVIDIA目前还没给出GF106 Die Size数值,我们无法得知测量误差大小。

针对中国市场定制的公版875MHz/1750MHz/4000MHz频率

GeForce GTS 450国际频率设定为783MHz/1566MHz/3600MHz
        GeForce GTS 450共有两个频率版本,其中NVIDIA针对全球公版设定的频率为783MHz/1566MHz/3600MHz,而同时NVIDIA(中国)针对中国特有的市场设定了一款高频GeForce GTS 450主攻中国市场,其频率高达875MHz/1750MHz/4000MHz,足以证明NVIDIA对中国市场和消费者的忠实,同时也可以看出GF106核心的超频能力十分了得,这样的频率设定是NVIDIA公版产品中设定的最高频率卡。

产品:双敏 无极2 GTS450 DDR5大牛版 显卡 GF106延续Fermi架构 传承GF104体系

GF106延续Fermi架构 传承GF104体系
        GF100、GF104和GF106都是基于Fermi架构打造,不过在规格矩阵上为了适应不同成本、定位的产品,进行了合理化的调整。例如GF100拥有超过30亿的晶体管、原生具备512个流处理器,而GF104拥有接近20亿的晶体管、原生384个流处理器。
        而GF106核心具备11.7亿晶体管、192个流处理器、128bit显存控制器,这些规格细心的用户能够发现正好是GF104的一半,难道二者有着相对更加紧密的关系?


GF100/GF104/GF106市场定位
        根据NVIDIA针对GF100、GF104和GF106的定位为除了一个较为形象的比喻,GF100拥有最猛火力的重装战士,而GF104是具备杀伤力武器的机动战士。而GF106被定义为“Sniper”(狙击手),拥有一击毙命的本事,足见NVIDIA对这款产品的厚望。

GF100和GF104核心架构图

GF106核心架构图
        通过上面GF100、GF104和GF106的核心架构图,我们发现虽然在整体架构上三者保持了Fermi的完整性,例如GPC→SM→CUDA Core由广到微的等级结构,例如独立的Polymorph Engine和Raster Engine的设计等。
        而且从GF104和GF106架构图中不难看出,就GPC、SM、CUDA Cores、MC控制器而言,GF106正好均为GF104的一半。
GF100 SM vs. GF104/GF106 SM
Graphics CoreGraphics CoreGF100GF104/GF106
SMCUDA Cores3248
Warp Scheduler22
Dispatch Unit24
SFU48
LD/ST16 个16 个
INT Unit3248
FP UnitFP32:32
FP64:16
FP32:48
FP64:24
Texture Unit48

        不过在微架构上,例如SM的CUDA Core等功能模块的组成,GF106延续了GF104的设计,即每组SM中包含48个CUDA Core、8个SFU和8个纹理单元等改良设计。相比拥有庞大规格的GF100而言,GF104的微架构的优化能够弥补先天规格不足的弊端,所以GF106传承了GF104微架构体系设计。
       ● GF106核心SM模块的设计优势
        GF106由于传承了GF104的SM微架构设计,原因很简单,从基于GF104核心打造的GeForce GTX 460性能表现就能看出,这种微架构的调整换来了在3D性能上更突出的表现,而GF106产品针对的用户群体更加明确,针对主流消费者用户设计,自然这类占绝对大比例的用户对产品的体验主要集中在3D效能体验,所以有了GF106这样的设计。
        当然这样并不是否定GF100核心SM微架构设计的不合理,毕竟GF100针对的用户群体是最高端的,同时还要兼顾通用计算方面的性能,所以才会有了GF100核心SM微架构设计。与其说NVIDIA针对不同用户群设计不同的定位的核心,不如说NVIDIA针对不同用户群设计了不同SM微架构的核心。

GF100 SM架构图

GF104/GF106 SM架构图
        GF106的一个SM中现在拥有48个CUDA Core,每个CUDA Core由两个Dispatch Port、Operand Collector、Result Queue以及INT整型数单元与FP浮点数单元构成。其中GF106的ALU和FPU均继承了GF100中CUDA Core的优良特性,例如ALI可以支持64bit精度指令运算,还有比较、布尔和移位等指令计算,值得一提的是Fermi架构的ALU通过改进现已完整支持32bit整数算法。同时FPU支持IEEE 754-2008标准,这一切一切的改变和支持都为Fermi架构在GPU通用计算上打下坚实基础。
        当然,在CUDA Core的优化上可以大幅提升GPU运算能力,但是没有良好的缓存设计及读写机制也无法发挥GPU的能力。在GF106的每个SM中与GF100一样,都包含LD/ST Cache、L1 Cache、Uniform Cache和Texture Cache。其中GF106拥有12KB的L1纹理缓存之外,还拥有真正意义的L1 Cache和L2 Cche可读写缓存。就每组SM而言,每组SM拥有8个纹理单元共享12KB的L1纹理缓存,32个CUDA Core使用16KB L1缓存搭配48KB共享缓存或48KB L1缓存搭配16KB共享缓存两种组合,最后还有768KB超大L2缓存。
        我们可以看到GF106每个SM中CUDA Core数量和Texture Unit数量均有大幅增加,这都会增加SM的3D计算能力,从而让用户在游戏体验上获得更好的效果。不过相反每个CUDA Core和Texture Unit分得的各类Cache有所减少,这应该是NVIDIA GPU架构工程师针对主流用户使用需求的前提下,在性能、晶体管平衡取舍上得出的最佳比例。

产品:双敏 无极2 GTS450 DDR5大牛版 显卡 高配没商量 GTS450标配1GB GDDR5显存

高配没商量 GTS450标配1GB GDDR5显存
        GDDR5已经成为目前主流产品的绝佳搭档,AMD方面除了最低端的Radeon HD 5450之外,其他所有型号都推出了GDDR5版或者Only GDDR5,NVIDIA方面从目前以发布的DirectX 11产品来来看,无一例外的都选择了GDDR5方案。GDDR5的好处不言而喻,高效、高频、高带宽、低电压,这三高一低的特色注定GDDR5将占领当今显卡显存使用的绝对大比例。
        我们前文曾提过NVIDIA针对GeForce GTS 450在中国市场设计的更好定位的公版,频率高达875MHz/1750MHz/4000MHz,而全球的公版频率为783MHz/1566MHz/3600MHz。不过无论哪种版本都是128bit/1024MB的组合,与GeForce GTX 460两个版本的设计有区别。


标配8颗SAMSUNG K4G10325FE-HC05颗粒
        GeForce GTS 450公版产品标配了8颗SAMSUNG K4G10325FE-HC05颗粒,每颗规格为32M*32bit,构成128bit/1024MB的显存规格组合。
         SAMSUNG K4G10325FE-HC05颗粒的理论极限等效频率为4000MHz,也就是说中国公版产品的显存频率已经为该颗粒的极限,不过我们知道理论极限并非颗粒的实际极限,起码还有10%左右的提升,再搭配上GF106的核心超频能力,整个产品还有很大潜力可挖。
 
显存颗粒布局方式(一)使用GF106-250-KA-A1核心
   
显存颗粒布局方式(二)使用GF106-250-KB-A1核心
        显卡共使用了了8颗PCB,分别位于PCB正反面各四颗。不过细心的用户会发现,在PCB正反两侧各有两个空焊显存位,再加上核心上GF106-250-KA-A1中“KA”的标识,不难让大家联想到GeForce GTX 460 768MB产品。
        ● GeForce GTS 450显存布局及空焊揭秘
        那么GeForce GTS 450也会像GeForce GTX 460 768MB一样留有硬件规格升级空间?

GeForce GTS 450核心及显存位设计
        我们可以看到在GeForce GTS 450的产品设计图上,仅有8颗显存设计。同时还可以看到需要6pin外接供电,PCI-Express为2.0版本;在视频信号输出接口上,根据上图了解到可以采用DVI*2+Mini HDMI或DVI + DP + Mini HDMI的组合,不过根据实际送测各品牌样卡了解到,D-Sub接口同样可以加入到组合中;最后SLI MIO桥仅为一个,与GeForce GTX 460一样。

PCB1060显存位设计
        NVIDIA为GeForce GTS 450设计的公版PCB版本好为P1060,PCB预留显存焊位12个,正反各6个。
   
核心型号与显存为之间的关系
        通过上图我们能够看到GeForce GTX 460 768MB的痕迹,与其一样,空焊有边4颗显存,对应的核心代号为“KA”,空焊中间4颗为“KB”,以此类推空焊左边4颗就为“KC”。

三种核心型号对应三种显存位
        根据上图我们了解到,GF106的显存控制器只能对打开2组控制接口,也就是说KA、KB、KC三个任意二者组合。同时必须为特定的KA、KB、KC位置,不能任意位置空焊4颗显存,与之对应的核心就为GF106-250-KA-A1、GF106-250-KB-A1、GF106-250-KC-A1。
        作为NVIDIA在4系列显卡中唯一的第一次发布即为满规格产品,预留的4个显存位有何寓意我们目前不知道,也许在GF106核心里还有很多秘密等待NVIDIA告诉我们,或者我们自己去发现。
产品:双敏 无极2 GTS450 DDR5大牛版 显卡 GTS450神似GTX460 却内有不同乾坤
        ● GTS450神似GTX460 却内有不同乾坤
         前面对GeForce GTS 450的核心、显存及规格进行了大量阐述,下面就让我们对GeForce GTS 450本身进行一个拆解介绍。


公版GeForce GTS 450显卡
        从外观而言,GeForce GTS 450与GeForce GTX 460极为相似,均采用了100%覆盖的导风罩设计,同时散热器风扇中置。接口方面公版的GeForce GTS 450采用了双DVI搭配Mini HDMI的组合,和其他所有NVIDIA 4系列DirectX 11产品一致。
   
PCB正反特写

PCB正面布线设计

公版PCB版本好为P1060
        GeForce GTS 450采用了P1060公版PCB设计,首先一颗GF106镇守PCB中央,周围设有1+3+2的显存位。由于GeForce GTS 450的TDP仅为105瓦,所以PCI-Express Gen2和6pin外接供电足以满足其需求。

核心采用3+1相供电设计

供电模组布线
        在供电方面,显卡配备3+1相供电模组,每相供电均采用屏蔽式电感、固态电容和八爪鱼式封装Mosfet。同时显卡TDP为105W,所以需要一个6pin外接供电,最大提供150W的电能输入。

视频接口采用DVI*2 + Mini HDMI组合
        显卡视频信号输出接口采用了DVI *2 + Mini HDMI的组合,这样的组合不仅能够满足普通用户的需求,还能满足高清用户的需求。值得一提的是,GeForce GTS 450支持NVIDIA推出3D Surround技术,在双卡SLI模式下实现三屏3D输出。

产品:双敏 无极2 GTS450 DDR5大牛版 显卡 低功耗/低发热 GTS450只需小巧散热器

低功耗/低发热 小巧风扇即可
        40nm工艺低功耗、低发热量的能力是不容忽视的,即使拥有11.7亿晶体管的GF106运行在875MHz核心频率下仅需一个纯铝散热模块和8cm静音风扇即可。想想拥有14亿晶体管采用55nm工艺制造的GT200核心,与GF104产品的散热器规模是天壤之别。


公版GeForce GTS 450散热器

散热器背面特写
        由于GeForce GTS 450的PCB长度为8.25吋,散热器整个覆盖PCB,不过与GeForceGTX 480不同的是,导风罩为开放式,这与中央风扇设计有关。

完全拆解的GeForce GTS 450
        对GeForce GTS 450进行了充分的物理拆解,总共可分为四部分,显卡主体、导风罩、核心散热模块和风扇。

标配的8cm风扇

风扇为AVC生产
        风扇采用了AVC设计的11叶8cm产品,型号为DAS0815R2U,电压12V、电流0.6A,这款产品在满载状态下会有大概65分贝噪音,在显卡待机状态下风扇噪音忽略不计,而且值得一提的是,笔者的平台为裸放,如果放到机箱中会更安静。

风扇支持4pin PWM调节
        这款AVC的风扇采用4pin供电,支持PWM调速技术,能够在性能、温度、噪音之间合理调配平衡点。

纯铝太阳花式核心散热鳍

散热器为2010年8月24日生产
        核心散热模块采用纯铝材质,通过铝挤技术一次成型。散热模块成太阳花式设计,每支散热鳍分为两岔,增加散热面积。

本帖最近评分记录:
  • 无痕币:+10(勇者无敌) 感谢分享,发帖辛苦!
  • Total 0.063692(s) query 3, Time now is:06-02 17:08, Gzip enabled 粤ICP备07514325号-1
    Powered by PHPWind v7.3.2 Certificate Code © 2003-13 秋无痕论坛