nvidia tesla t4性能测试(NVIDIA发布图灵架构计算卡Tesla)
GTC 2018图形技术大会日本站上,NVIDIA发布了一款新的计算卡Tesla T4,第一次采用和RTX 20系列游戏卡一样的Turing图灵架构,核心规格超越RTX 2070,功耗却低得不可思议。
Tesla T4搭配TensorRT软件组成的新平台,主要面向AI应用,包括智能语音、翻译、视频、图像、推荐等应用领域,号称处理查询的速度比仅采用CPU时快了40倍,同时延迟更低。
该卡采用了PCI-E扩展卡样式,全覆盖金属外壳,散热器隐藏在内部,整体极具质感也相当干练,同时因为面向计算领域而没有视频输出接口。
它配备了2560个图灵架构CUDA核心,低于RTX 2080 2944个,但是高于RTX 2070 2304个,同时集成320个Tensor推理核心,但未提及RT光线追踪核心,可能因为无用而被屏蔽。
性能方面,FP32单精度浮点计算性能8.1TFlops(每秒8.1万亿次),FP16/32半精度和单精度混合计算性能65TFlops,INT8、INT4整数计算性能则是130Tops、260Tops。
显存搭配16GB GDDR6,双倍于游戏卡,不过带宽仅320GB/s,因此要么降低了位宽,要么降低了频率。
最外的是功耗,整卡仅75W,无需辅助供电,而核心规模更小、计算性能更低的RTX 2070还要175-185W,显然这块卡在计算、功耗方面都做了特殊的优化,同时似乎也暗示RT光线追踪是相当的耗电。
,
免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com