titanx 双卡(一篇文章解读9499元新旗舰Titan)
在今年的三季度初期, NVIDIA出乎意料的公布了最新的旗舰显卡“Tiatn X”,并且其最终的标价为1200美元(相当于8000左右人民币)。
不是GP102完整核心;之前宣称的HBM 2.0显存也没有“兑现”……种种的“减配”已经有很多玩家们将最新的“Tiatn X”定义成了“乞丐版”。而对那些手里有钱的发烧友来说,最新的制程和Titan X的“约束”,我们再也不能够用最新的旗舰显卡玩出4路SLI互联。
当人们还在处于议论当中,国行版的“Titan X”出现在了京东商城上,并且于昨日和今日开启了抢购,最终的国行Titan X显卡的售价定格在9499元人民币;高于1200美元的售价也是在我们的意料之中,毕竟国内的各种税费在“作祟”。
然而接近万元的售价并没有阻挡国内DIY爱好者们的采购,首批的Titan X旗舰显卡1分钟之类就被抢光,京东页面也高高挂起了“无货”。那么究竟是为何众人都在吐槽的这块新旗舰还卖到这么贵;又是为什么如此高的价格还被抢购一空呢?也许很多人也都陷入了沉思中。
不完整核心是Titan X硬伤?
还记得前不久NVIDIA曝光的“Tesla P100”么?没错,就是那个专为超级计算机而生的超级显卡,“Tesla P100”是基于GP100核心的产物,然而这毕竟是高性能计算所诞生,消费级的市场中也注定不会有GP100核心架构的显卡产品,取而代之的是GP102架构,而这两天卖得火爆的“Titan X”就是该架构旗下的首款产品。
但比较尴尬的是,“Titan X”却使用的不是“GP102”架构的完整核心;而“GP102”架构虽然是替代“GP100”所投入消费级市场的,但“GP102”架构却与“帕斯卡”10系显卡的“GP104”极为相似,或者说基本相同。
GP102架构核心
如果将GTX1080和Titan X这二者放在一起,这就特别好解释了。我们回头看看“GP100”架构,它支持HBM 2.0显存且使用非常极端的FP64双精度单元,然而这些设计在“GP102”架构中却没什么意义,成本上去了售价会更加不好控制,然而“GP102”和“GP104”这两个架构非常相似,只是在呈现的形式和规模上有所不同。“GP104”核心拥有4组GPC单元每组由5个SM单元组成,每个SM单元又有128个CUDA核心,搭配256bit位宽。而GP102核心拥有6组GPC单元,完整版是30组SM单元,3840个CUDA核心,位宽384bit,规模比GP104直观提升了将近50%。
没错,说到这,很多网友已经知道了真相。“Tiatn X”所使用的“GP102”架构核心真的被阉割了,它砍掉了2组SM单元,CUDA核心数也下降到了有零有整的3584个,但不要以为“Tiatn X”真是到了极限不能再强;完整版GP102核心用在了刚发布不久的Quadro P6000显卡上……性能完全强于“Tiatn X”。
对此,NVIDIA官方也对“Titan X”这款期间卡以“Ultimate”而最终定义和命名,但“Quadro P6000”这款产品,NVIDIA已经将其描述成为全世界最快的显卡。当然,“Titan”用“阉割”版的核心也并不是第一次,最早的基于“GK110核心”的“Titan”也是不完整核心,等到“Titan Black”出来的时候才是“GK110”核心的完美形态;最新的“Titan X”以一个“阉割版”的状态所上市,从其价格定位来看,也未必是件坏事。
“黑科技”前只能玩双路?
如果你是土豪,那么接下来这个消息或许会让你失望,最新的Titan X显卡目前只支持双路SLI互联。
从GTX 1080的这一代显卡开始,不知道为何NVIDIA开始限制多卡SLI互联,就连个像样的限制理由都没有。但有传闻称,此前需要玩家去官方申请密钥解锁,但直到现在NVIDIA还是没有给出具体的解锁流程,在这个流程登出以及执行之前,3卡、4卡的SLI互联还都是泡沫。
4路SLI暂时玩不了
至于Titan X显卡的3卡、4卡SLI支持,NVIDIA并没有给出明确的回答,在官方页面上可以看到NVIDIA是以“支持HB SLI桥接器”来体现的。那么我们来回顾一下“HB桥接器”,NVIDIA的“SLI HB”桥只推出了双路的规格,现在并没有3、4路的支持。
当然,以后也不排除新的旗舰卡能够支持3、4路的SLI互联,但起码目前还不行,从现在的程度来看,Titan X理论上可以支持4卡互联,但实际操作起来真的不容易,当然这也许也都是NVIDIA官方的一些限制。
浮点运算并非继续阉割
关注当时“Tesla P100”上市时的信息不难发现,“GP100”架构最大的惊喜就是重新强化了架构的双精度计算能力。“GP100”架构可以说比之前的所有架构都出色,每个SM单元中植入了更多的FP64单元,并且针对于单元翻倍的数量,FP64性能达到了FP32单精度的一半,FP32浮点性能是10.6TFLOPS,FP64性能为5.3TFLOPS,说它是一款超级计算机所运用的显卡一点都不足为过。
在“GP100”架构身上,我们看到的不止有这些,它支持FP16半精度全速运算,FP16性能达到了21.6TFLPOPS。不过在GP102身上,双精度被砍是必然的,因为FP64单元不仅会占用大量核心面积,对功耗、发热也会有影响,更重要的是在非专业计算市场上,FP64精度的需求并不高。
新Titan拥有更低的发热量和功耗
但是NVIDIA砍掉的不仅仅是双精度,半精度也直接被砍掉了,但取而代之的是FP8精度,它的性能为44TFLOPS。在此要说明一件事儿,阉割了FP64和FP16不代表GP102完全不支持这两种运算精度,最终以什么方式来呈现,我们还是要静等NVIDIA官方的答复。
由于阉割FP64的缘故,核心的面积把压缩到610mm*610mm,其中罗列了上百亿个晶体管,而“GP102”核心的面积是471mm*471mm,这样的配置在很有效的降低成本的同时,也更好的限制了核心的功耗和原本恐怖的发热量。
同名?取消了GeForce!
很多人在公布这块显卡的时候就已经发现,这款显卡没有换名字?其实不然,之前的前缀“GeForce”已经找不到了。
那么NVIDIA为什么要去掉“GeForce”品牌名呢?
新的Titan X取消了“GeForce”前缀
对于这个问题,官方解释说GeForce是消费级显卡的品牌,但Titan X显卡的目标用户不仅仅是游戏玩家,新Titan X显卡的运算能力也非常强筋,可以说这是一块全能的旗舰卡。1200美元的售价确实比上一代官方报价上涨了不少,但取消“GeForce”恰恰验证了NVIDIA不想将其定义成一款游戏卡,对于游戏显卡来说1200美元这价格确实是贵了,但是从专业卡的角度来看:嗯,便宜!
写在最后:
涨价、没有“GeForce”、不完整核心,议论它的负面评论有太多太多,但依旧挡不住首日几秒售罄的现状。不错,“Titan X”到底值不值得买还有待商榷,本文也是通过技术层面向网友们解读和分析了这款新旗舰显卡的种种配置和表现。如果你对这款新旗舰有什么想法,还请在文章下方给笔者留言,笔者也会实时互动,为大伙解读力所能及的问题。
,免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com