linux驱动K10运算卡,NVIDIATESLA丽台K20K10C2075C2070运算加速卡

news/2024/10/17 18:13:58/

实物图 NVIDIA的GK110核心**早就是用于Tesla产品线的,不过去年发布的...

NVIDIA Tesla K20 GPU运算卡,超算“**”拥有71亿个晶体管、2496个流处理器、320-bit位宽,显存容量5GB GDDR...

实物图在GTC 2012大會上,NVIDIA老總黃仁勳公佈了新一代Tesla加速卡的...

实物图

d7fafc30b4d81f3a9d93bbd3ec533b9b.png

358e913c68c6dfab29a180c666411417.png

922241c3ae9949a24c6ce09e507fe0f8.png

b3f2a919d2a8e70e7a3e038b19e92323.png

3df6e586d1fe2202ee481195a1ddf325.png

e84611ab5ed4a2ee689eaa4ac79a3c9c.png

在GTC 2012大會上,NVIDIA老總黃仁勳公佈了新一代Tesla加速卡的詳情,不過此次**布的Tesla顯卡算是雙胞胎,一款是基於雙芯GK104架構的Tesla K10,另外一款則使用了真正的新架構,基於GK110核心的Tesla K20。

K10和K20的特性有所不同,重點也不一樣

76ae5ca00289225df787e32512871486.png

首先來看K10,它的物理外觀與GTX 690顯卡沒什麼區別,但是NVIDIA公佈的幾項參數耐人尋味, 單精度浮點能力為4.58TFLOPS,帶寬為320GB/s ,作為對比的是GTX 680單精度運算能力3.09TFLOPS,192GB/s帶寬,而GTX 690也有5.62TFLOPS,384GB/s帶寬,上一代Fermi核心浮點運算能力為1.58TFLOPS,帶寬192GB/s。

從參數上看,K10達到了NVIDIA所說的三倍於Fermi家族的單精度浮點能力,但是比GTX 680只提高了50%,帶寬也只高了了67%左右,明顯不如GTX 690顯卡。

由於是同樣的架構,Tesla K10很明顯在核心和顯存頻率上做了妥協,由於GK104架構的能效比很高,而HPC領域對功耗、**熱也不甚敏感,不知NVIDIA為何將K10的規格定的比GTX 690還低。

現場的圖片沒有公佈K10的顯存容量和TDP信息,但是GeForce GRID頁面出現的K520顯卡規格與K10一致,而顯存容量是8GB,TDP是250W,二者其實都是雙芯GK104顯卡,因此Tesla K10也是8GB顯存,250W TDP 。 (這個功耗低於GTX 690的300W,或許是規格降低**可能的解釋了)

Tesla K10現在就可以出貨,但是它並不是重點, 個人覺得它只是個過渡產品,扮演救火隊員的角色 ,因為GK104先天孱弱的雙精度運算能力注定了它**能在HPC市場有多高的成就,NVIDIA之所以推GTX 690上陣是因為GK110架構來的比預期的還要晚。

GK110是NVIDIA針對高性能GPU計算市場開**的架構, 之前一直傳聞到今年8月份就會**布,但是NVIDIA給出的日期是今年第四季度 ,不論是28nm產能還是芯片自身的問題,這大半年的空白期總需要有人先頂上,這就是K10的使命了。

Tesla K20與GK110架構

NVIDIA對K20的描述是“3倍雙精度浮點性能”,並有Hyper-Q、Dynamic Parallelism等多種並行計算技術加持,這些是現有的GK104架構不具備的。

NVIDIA的PDF資料中介紹了GK110的SMX架構,也是192個CUDA核心

8f61e75361486a81e04c72271fd8199b.png

必須要承認,以前洩露的有關GK110架構的消息是錯誤的,GK110的SMX架構其實跟GK104還是一樣的,都是192個CUDA核心,32組SFU單元以及32個LD/ST單元。

GK110架構圖

8f44df2f467b7ea74e8377d1dfae854d.png

除去其他的功能單元之外,GK110核心總共有15組SMX單元,2880個CUDA核心, 但是Heise聲稱並非所有單元都是啟用的,實際上可能只有13-14組SMX單元,實際CUDA核心是2496或者2688個。

顯存位寬是384bit,已為黃仁勳和NVIDIA CTO確認 。 由於CUDA核心數已經低於之前的報導,顯存位寬降到384bit也是很自然的事,如果保持GK104的6Gbps顯存速率,那麼GK110的帶寬將達到288GB/s,終於超過AMD GCN架構的260GB /s了。

NVIDIA給出的3倍雙精度浮點性能不知是跟GF110顯卡還是跟GF110核心的Tesla加速卡做的比較,GF110的單精度浮點能力為1.58TFLOPS,顯卡中的雙精度為單精度的1/ 4,也就是0.4TFLOPS,但是GF110核心的Tesla卡雙精度能力可達單精度1/2,大約是0.8TFLOPS。

如此一來,如果以顯卡為基礎,GK110的雙精度浮點性能大約是1.2TFLOPS以上,如果是Tesla卡的3倍,那就是2.4TFLOPS以上,鑑於後者已經超出之前傳聞的2TFLOPS的能力, GK110的雙精度浮點能力應該是1.2TFLOPS或更高 。

Tesla K20配置了6pin+8pin供電接口

f9cceecf70877221b8f0fa3858576056.png


http://www.ppmy.cn/news/191423.html

相关文章

dell m4800

dell 移动工作站

宇视VX系列服务器,VS-HD4000V-02 4TB VX1848 宇视 存储 一体化SATA企业级硬盘

VS-HD4000V-02 4TB VX1848 宇视 存储 一体化SATA企业级硬盘批发TEL:13910098771 品牌 宇视 规格 企业监控级 4TB 类型 企业级监控硬盘 容量 4TB 外部输出接口 SATA NI-HD4000V-01 4TB*2 VX1848 H3C宇视 存储 一体化SATA企业级硬盘批发 管理平台:宇视VS-VM5800-UV IP磁盘存储…

海海软件DRM-X 4.0产品介绍

海海软件DRM-X 4.0 产品介绍 海 海 软 件 海海软件位于苏沪交界处昆山花桥经济开发区--花桥国际商务城,是一家专业从事于开发DRM数字版权管理产品和多媒体解决方案的技术型公司。海海软件经过微软的严格测试和验证,成为中国大陆第三家Windows Media Ser…

IBM System x3400M3服务器维修案例 RAID0恢复

大家好 2022年国庆放假后整个人完全没有一点上班的心思,最近辛吉飞挺火的,纯纯的科技与狠活。打开电脑也不知道干点啥,索性就分享一个最近刚处理的服务器故障问题案例。 客户是来自湖北省咸宁市的饶先生 应该也是通过网络找到我们的&#xf…

丽台 A6800XT TDH (AGP) 显卡软件开管和超频手记

前几天跑到电脑城中乱逛,不小心买了2根金士顿DDR400 1G的内存条,今天突然心血来潮把去年购买的AGP接口的丽台6800XT显卡进行软件开管测试。首先声明电脑是N年前配的,显卡购于2006年2月,内存购于2006年12月的最后一周周末&#xff…

丽台显卡p1000渲染好吗_渲染p

丽台显卡p1000渲染好吗 There are many performance tools built-in Chromium out of the box, that could help you find and debug performance issues in your app. The key to success is using the right tool for the task, exactly like bringing the right gun for a f…

丽台显卡测试软件,丽台Quadro FX4600专业显卡试用评测

前言 - 测试环境 - 二 测试项目 - 三 测试与对比 - 四 结论 -编者按NVIDIA Quadro FX 4600新一代的顶点及像素着色系统Shader Model 4则为OpenGL与最新一代DirectX 10等专业应用程序带来了更好的表现与逼真的效果。单看FX4600外观,较长的PCB板、丽台豪华涡轮风扇散热…

多线程安全的案例展示与解决方案

一、概念 1. 什么是线程安全 当多个线程访问一个对象时,如果不用考虑这些线程在运行时环境下的调度和交替执行,也不需要进行额外的同步,或者在调用方进行任何其他的协调操作,调用这个对象的行为都可以获得正确的结果&#xff0c…