【IT168 评测】于北京时间2013年2月19号晚上10点,NVIDIA正式发布了基于Kepler架构GK110核心的新旗舰级显卡——GeForce GTX Titan。我们都知道GK110核心早在去年的GTC 2012上就已经亮相过,当时强大的规格,惊人的浮点运算能力已经让人叹为观止,可惜当时这仅是针对于超级计算机的NVIDIA Tesla K20X加速卡。而本次GeForce GTX Titan的正式发布同样给我们带来不少惊喜。
▲DNA Of the World’s Fastest Supercomputer
为何被命名为“GTX Titan”? 位于美国田纳西州橡树岭的Titan超级计算机装备了18688颗NVIDIA Tesla K20X GPU,在LINPACK基准测试中创下了17.59Petaflops的性能纪录,轻松夺得了TOP500榜单上的全球最快超级计算机的头号排名。而“Titan”这名号也被应用到桌面级市场上——“DNA Of the World’s Fastest Supercomputer”,寓意了这是全球最快、具备全球最快超级计算机的DNA的显卡。
▲强大的GeForce GTX Titan,GK110核心
GeForce GTX Titan的规格是相当的猛,2688个CUDA Cores,浮点性能为单精度FP32 4.5TFlops、双精度FP64 1.3TFlops,晶体管总数更是达到了71亿个。笔者看来,GeForce GTX Titan真不是一块显卡了,应该是超级显卡才对。拥有这么一款显卡就可以打造一台全球最强的个人游戏PC,同时拥有的强大运算能力堪比小型服务器。
NVIDIA GTX Titan规格概述 ▲GeForce GTX Titan详细规格
没有GTX680(GK104)那样冲破1Ghz的核心频率,GTX Titan(GK110)十分注重每瓦性能比,核心频率被控制在827MHz,GPU Boost频率也仅为876MHz。但即便是这样,受CUDA数量以及晶体管数据的负面影响,TDP热设计功耗达到了250W,比GTX680的195W高不少。同时显卡需要配备6+8Pin的辅助供电才能满足供电需要。
显卡核心规格对比 |
vga.it168.com | NVIDIA GeForce GTX Tittan | NVIDIA GeForce GTX690 | NVIDIA GeForce GTX680 | AMD Radeon HD7970 GE |
核心代号 | GK110 | GK104*2 | GK104 | Tahiti |
制造工艺 | 28nm | 28nm | 28nm | 28nm |
晶体管数量 | 71亿 | 35亿*2 | 35亿 | 43.1亿 |
核心面积 | 约570mm² | 294mm² | 294mm² | 365mm² |
显卡核心架构对比 |
DirectX 版本 | DirectX 11.1 | DirectX 11.1 | DirectX 11.1 | DirectX 11.1 |
流处理器数量 | 2688 CUDA | 1536 CUDA*2 | 1536 CUDA | 2048 SP |
纹理单元 | 224 | 128*2 | 128 | 128 |
ROP单元 | 48 | 32 | 32 | 32 |
核心频率 | 837Mhz | 915Mhz | 1006Mhz | 1000Mhz |
Boost频率 | 876Mhz | 1019Mhz | 1058Mhz | 1050MHz |
显存频率 | 6008Mhz | 6008Mhz | 6008Mhz | 6000Mhz |
显存类型 | GDDR5 | GDDR5 | GDDR5 | GDDR5 |
显存容量 | 6144MB | 2048MB | 2048MB | 3072MB |
显存位宽 | 384Bit | 256Bit*2 | 256Bit | 384Bit |
显存带宽 | 288.4GB/s | 192.2GB/s*2 | 192.2GB/s | 280.0GB/s |
设计功耗 | 250W | 300W | 195W | 250W |
供电接口 | 6+86Pin | 8+8Pin | 6+6Pin | 6+6Pin |
输出接口 | DP HDMI 2*DVI | DP HDMI 2*DVI | DP HDMI 2*DVI | 2*mDP HDMI DVI |
零售报价 | 7999元 | 7999元 | 3299~3999元 | 3299~3999元 |
从规格上来看,GTX Titan是绝对的王者。借鉴到GK104核心GTX680的性能表现,GTX Titan显卡性能肯定要比GTX680/HD7970 GE高出一截。而且配备6144MB超大显存容量、384Bit显存位宽、以及6008MHz显存频率,即便是在高分辨率高画质,甚至是多屏输出情况下都有着较好的性能表现。
▲GTX Titan是唯一能玩爽CRYSIS 3 @5760*1080的显卡
问:GK110为什么使用384-bit位宽而非512-bit?
答:使用512-bit位宽也会导致功耗及其他代价升高,GK110使用384-bit位宽则可以在性能和代价中保持平衡。
GK110核心强大之处 ▲GK110核心示意图
为何GK110有这么多的晶体管数量呢?原因在于GK110比GK104拥有更多的CUDA核心数量、更多的显存控制器数量、ECC校验单元以及运算双精度单元;SMX单元也增加到了15组之多,每级SMX单元保持192个CUDA Cores的设计,也就是说GK110实际上是拥有2880个CUDA。
▲GK110核心架构图
现在的GeForce GTX Titan与Tesla K20X都仅有2688个CUDA Cores,明显就是屏蔽了一组SMX单元192个CUDA Cores。而为了为满足带宽传输需求,GK110提供了六组GDDR5显存控制器,组成384Bit显存位宽,显存带宽提升至256GB/s。可以结合GK110核心示意图与看到,6组显存控制器摆在最外边,包围着SMX单元。
▲GK110与GK104对比
除此之外,GK110为了增加双精度计算能力,在每组SMX提供多达64个FMA双精度单元,对比GK104只有8个FMA双精度单元。同时GK110也是首款支持Hyper-Q、Dynamic Parallelism并行调度的GPU。相比GK104有了显著的改善,这也是NVIDIA将GK110计算定位3.5代的原因。
资料参考:NVIDIA GK110白皮书
新型GPU Boost 2.0 技术 ▲新型GPU Boost 2.0 技术
在GK104核心上,NVIDIA首次引入了GPU Boost技术,称之为“GPU Boost 1.0”。通过此技术,显卡能够在TDP允许的范围内,根据GPU负荷、功耗、电压以及GPU温度等数据实现自动超频,尽可能地提高GPU运行频率,进而提升GPU工作效率。而现在GK110核心上采用的是改进型的“GPU Boost 2.0”,当然两者本质上区别不大,只是GPU Boost 2.0能带来更高的GPU Boost频率。
简单一句话:新型的GPU Boost 2.0可自动提升图形性能,支持解锁电压和高级控制功能,让玩家可以更大限度地控制游戏和自定义超频。
▲GPU Boost 2.0中的频率可以跑得更高
▲GPU Boost 2.0增加更好的图形性能:更高电压,更平滑的高频表现
▲GPU Boost 2.0提供更高的电压
▲更好的游戏体现,MAX频率更高
▲电压太高则适得其反,优先保护显卡
▲即使是高温下也有着稳定的性能表现
▲性能、温度以及噪音控制有着更好的表现
▲刷新频率也可以超频,从60Hz提升到80Hz
▲更进阶的控制,十分适合DIY玩家
NVIDIA GTX Titan公版产品介绍 ▲NVIDIA GTX Titan公版
▲NVIDIA GTX Titan公版
▲NVIDIA GTX Titan公版
▲NVIDIA GTX Titan公版
▲NVIDIA GTX Titan公版
▲NVIDIA GTX Titan公版
▲NVIDIA GTX Titan公版
▲NVIDIA GTX Titan公版
▲NVIDIA GTX Titan公版,支持3+1屏1080P输出
NVIDIA GTX Titan公版拆解 ▲NVIDIA GTX Titan公版拆解
▲NVIDIA GTX Titan公版PCB
▲NVIDIA GTX Titan公版显卡GK110核心
虽然GK104走的是中型核心战略,但NVIDIA并没有忘记大核心制胜,GK110明显就是大核心。拥有71亿个晶体管数量,让其核心面积达到了约570mm²,而GK104仅为290mm²,GK110几乎是GK104一倍。
▲正反两面PCB共24颗显存颗粒
▲三星GDDR5显存颗粒
显存选用三星的2GBitt GDDR5显存颗粒,正反两面24颗64MB*32Bit规格颗粒组成了6144MB/384Bit显存规格。显存颗粒编号为:K4G20325FD,后缀为:FC03,理论工作频率为6000MHz。实际上些颗粒可以跑到6600MHz,超频空间还不少。而笔者发布,三星GDDR5 PDF里已经显示有4GBitt GDDR5显存颗粒,也就是说GTX Titan或者还可以做到12GB容量也不定,当然新颗粒价格高、产量低。
▲6+2相供电设计,其中6相为核心供电
▲2相显存供电
2相显存供电设计相当的简单,一个2相供电控制芯片与两组各一个R33贴片电感+安森美的SO-8FL封装的4901NF MOSFET。
▲主控芯片为安森美NCP4206六相PWM控制器
而6相核心供电的主控则为安森美出品的NCP4206六相PWM控制芯片,此主控也用在GTX690顶级显卡上。主控电气性能相当不错,只可惜安森美官方并没有给出详细规格,但可以从NCP4208中窥探一二。而主控仍像GTX680一样做在一块小PCB上,这样据说是方便NVIDIA以及厂商测试及采用不同方案的主控而为。
▲搭配的是飞兆FDMF6823 DrMos芯片
由于NCP4206主控并没有内置驱动IC,所以配备DrMOS也很正常。DrMOS采用的是飞兆出品的FDMF6823 DrMOS芯片,集成了驱动IC、高压MOS以及低压MOS。此款DrMOS规格也相当强大,最高能支持60A电流,而且超过93%的转换率。
▲可组成双8Pin辅助供电设计
显卡默认配备6+8Pin辅助供电,而PCB上则余留了多一个8Pin辅助供电接口位置,笔者相信此PCB可做成双8Pin辅助供电设计,但得需要修改散热方案了。