cuda-z/gpu-z/cpu-z工具分析GPU显卡和CPU算力信息

news/2024/10/22 12:32:13/

类似于Windows下使用CPU-Z工具查看CPU信息,Linux下也可以使用CUDA-Z工具来查看显卡资源/支持信息。

CUDA-Z运行需要主机首先已经安装CUDA和N卡驱动为前提,具体步骤可参考博客:

Darknet CUDA/CUDANN环境的快速安装_tugouxp的专栏-CSDN博客

之后便可以开始下面的步骤:

下载cuda-z

cuda-z在sourceforge上开源,主页地址:CUDA-Z

根据主页提示进入下载页:

下载后得到文件CUDA-Z-0.10.251-64bit.run

 运行:

CUDA-Z-0.10.251-64bit.run是个绿色程序,添加可执行属性后直接运行即可,界面如下:

核心信息:

 显存信息:

不过NVIDIA 2G的显存并没有映射到BAR上。

算力信息,1TFLOPS=1000GFLOPS,所以这里单精度浮点算力为1.2TFLOPS左右。

Single Precision Float1192.48 Gflop/s
Double Precision Float20.6227 Gflop/s
64-Bit Integer23.0647 Giop/s
32-Bit Integer398.375 Giop/s
24-Bit Integer289.689 Giop/s

GPU算力特点,和CPU相比的不同:

CPU除了负责浮点整形运算外,还有很多其他的指令集的负载,比如像多媒体解码,硬件解码等,因此CPU是多才多艺的。CPU注重的是单线程的性能,要保证指令流不中断,需要消耗更多的晶体管和能耗用在控制部分,于是CPU分配在浮点计算的功耗就会变少。

GPU基本上只做浮点运算的,设计结构简单,也就可以做的更快。GPU注重的是吞吐量,单指令能驱动更多的计算,相比较GPU消耗在控制部分的能耗就比较少,因此可以把电省下来的资源给浮点计算使用。

工具信息:

Windows下的GPU-Z

Windows下还有另外一款GPU分析工具叫做GPU-Z,估计是模仿CPU-Z起的名字,GPUZ不但可以分析N卡,还能对其它厂家的显卡比如英特尔的集成显卡进行分析,从下拉列表中选择你想获取信息的显卡,界面将会自动刷新。

 N卡信息:

 英特尔显卡:

从对CUDA的支持可以看出两类显卡的一个明显差异。

再来看一个AMD的显卡,可以看到不支持CUDA,不支持光追。

对比可以发现,AMD的显卡全面优于INTEL的集成显卡。

GPU性能测速

使用gpu-burn测试GPU 单精度,双精度以及tensor core的计算能力.

1.下载gpu-burn

$ git clone https://github.com/wilicc/gpu-burn

 2.编译

$ cd gpu-burn
$ make

3.测试

测试单精度

zlcao@zlcao-RedmiBook-14:~/gpu/gpu-burn$ ./gpu_burn 60
Burning for 60 seconds.
GPU 0: NVIDIA GeForce MX250 (UUID: GPU-657800de-5f00-da64-7c46-68e7e31fcae1)
Initialized device 0 with 2001 MB of memory (1878 MB available, using 1690 MB of it), using FLOATS
Results are 16777216 bytes each, thus performing 103 iterations
13.3%  proc'd: 412 (1022 Gflop/s)   errors: 0   temps: 44 C Summary at:   2023年 01月 28日 星期六 19:31:36 CST25.0%  proc'd: 721 (1020 Gflop/s)   errors: 0   temps: 48 C Summary at:   2023年 01月 28日 星期六 19:31:43 CST36.7%  proc'd: 1236 (1018 Gflop/s)   errors: 0   temps: 55 C Summary at:   2023年 01月 28日 星期六 19:31:50 CST48.3%  proc'd: 1648 (1021 Gflop/s)   errors: 0   temps: 58 C Summary at:   2023年 01月 28日 星期六 19:31:57 CST60.0%  proc'd: 2060 (1013 Gflop/s)   errors: 0   temps: 61 C Summary at:   2023年 01月 28日 星期六 19:32:04 CST71.7%  proc'd: 2472 (1013 Gflop/s)   errors: 0   temps: 62 C Summary at:   2023年 01月 28日 星期六 19:32:11 CST83.3%  proc'd: 2781 (1013 Gflop/s)   errors: 0   temps: 63 C Summary at:   2023年 01月 28日 星期六 19:32:18 CST95.0%  proc'd: 3296 (1012 Gflop/s)   errors: 0   temps: 65 C Summary at:   2023年 01月 28日 星期六 19:32:25 CST100.0%  proc'd: 3605 (1009 Gflop/s)   errors: 0   temps: 66 C 
Killing processes.. Freed memory for dev 0
Uninitted cublas
doneTested 1 GPUs:GPU 0: OK

测试双精度

./gpu_burn -d 60
Burning for 60 seconds.
GPU 0: NVIDIA GeForce MX250 (UUID: GPU-657800de-5f00-da64-7c46-68e7e31fcae1)
Initialized device 0 with 2001 MB of memory (1878 MB available, using 1690 MB of it), using DOUBLES
Results are 33554432 bytes each, thus performing 50 iterations
36.7%  proc'd: 50 (39 Gflop/s)   errors: 0   temps: 47 C Summary at:   2023年 01月 28日 星期六 19:36:51 CST50.0%  proc'd: 50 (39 Gflop/s)   errors: 0   temps: 49 C Summary at:   2023年 01月 28日 星期六 19:36:59 CST66.7%  proc'd: 50 (39 Gflop/s)   errors: 0   temps: 51 C Summary at:   2023年 01月 28日 星期六 19:37:09 CST83.3%  proc'd: 100 (39 Gflop/s)   errors: 0   temps: 52 C Summary at:   2023年 01月 28日 星期六 19:37:19 CST100.0%  proc'd: 100 (39 Gflop/s)   errors: 0   temps: 54 C Summary at:   2023年 01月 28日 星期六 19:37:29 CST100.0%  proc'd: 100 (39 Gflop/s)   errors: 0   temps: 54 C 
Killing processes.. Freed memory for dev 0
Uninitted cublas
doneTested 1 GPUs:GPU 0: OK

测试tensor core

./gpu_burn -tc 60
Burning for 60 seconds.
GPU 0: NVIDIA GeForce MX250 (UUID: GPU-657800de-5f00-da64-7c46-68e7e31fcae1)
Initialized device 0 with 2001 MB of memory (1878 MB available, using 1690 MB of it), using FLOATS, using Tensor Cores
Results are 16777216 bytes each, thus performing 103 iterations
11.7%  proc'd: 412 (1025 Gflop/s)   errors: 0   temps: 59 C Summary at:   2023年 01月 28日 星期六 19:38:16 CST23.3%  proc'd: 824 (1025 Gflop/s)   errors: 0   temps: 61 C Summary at:   2023年 01月 28日 星期六 19:38:23 CST35.0%  proc'd: 1236 (1018 Gflop/s)   errors: 0   temps: 63 C Summary at:   2023年 01月 28日 星期六 19:38:30 CST46.7%  proc'd: 1648 (1014 Gflop/s)   errors: 0   temps: 64 C Summary at:   2023年 01月 28日 星期六 19:38:37 CST58.3%  proc'd: 1957 (1013 Gflop/s)   errors: 0   temps: 65 C Summary at:   2023年 01月 28日 星期六 19:38:44 CST70.0%  proc'd: 2472 (1015 Gflop/s)   errors: 0   temps: 67 C Summary at:   2023年 01月 28日 星期六 19:38:51 CST81.7%  proc'd: 2884 (1017 Gflop/s)   errors: 0   temps: 67 C Summary at:   2023年 01月 28日 星期六 19:38:58 CST91.7%  proc'd: 3193 (1015 Gflop/s)   errors: 0   temps: 68 C Summary at:   2023年 01月 28日 星期六 19:39:04 CST100.0%  proc'd: 3605 (1015 Gflop/s)   errors: 0   temps: 69 C 
Killing processes.. Freed memory for dev 0
Uninitted cublas
doneTested 1 GPUs:GPU 0: OK

得到的数据和上面cuda-z得到的还是非常接近的。

-tc指定tensor core上跑的原理是会导致cublasSetMathMode的执行。

 其中的参数CUBLAS_TENSOR_OP_MATH 根据官方文档,表达让GPU尽可能的利用tensor core去完成计算。


结束!


http://www.ppmy.cn/news/147431.html

相关文章

7z 头部错误 数据错误_打开一个7z的加密文件,显示CRC错误操作出错怎么办

展开全部 判断出错原e68a843231313335323631343130323136353331333363353737因 出错信息为“CRC失败于加密文件(口令错误?)”(RAR压缩包设了密码,但密码输入错误或是密码输入正确但循环冗余校验码(CRC)出错!只不过因为此RAR压缩包加了密码的缘故,所以WRAR才猜测说可能是“口…

统计_z值

z值:实质是偏离均值标准差的个数。 不同分布的z值具有可比性,例如N(0,1)的数据1的z值是1,表示离均值0有一个标准差,另外N(100,10)的数据110的z值也是1,表示离均值100有一个标准差,这样的话可以将不同的分布…

使用Gpu恢复7z密码

转自:https://www.shellntel.com/blog/2017/2/8/how-to-build-a-8-gpu-password-cracker HOMEBLOGABOUT US How to build a 8 GPU password cracker February 13, 2017 TL;DR This build doesnt require any "black magic" or hours of frustration like …

z-score

最近处理数据时,经常用到Z-score处理方法,所以把自己了解到的知识汇集在此,对自己也是个提升,希望对别人也有所帮助。 (1)Z-score定义 由于Z-score的数据分布满足“正态分布”(N(0,1)),而“正态…

在技嘉GA-Z68X-UD3H-B3上安装macOS-MOJAVE-10.14

原文地址:http://mcdojf.wixsite.com/z68x 重点说明: 这个版本也支持我的技嘉GA-Z68M-D2H的UEFI BIOS,但目前MacOS10.14还不能支持AMD ATI 6850系列显卡,请慎重考虑。 最终我用MacOS10.14版本的EFI在我的GA-Z68M-D2H上安装和使…

装机选哪款?2011年度主板芯片组回顾【转】

2011年度主板芯片组回顾 2011年剩下的天数已经可以用一只手数过来了,在这最后几天中,笔者为大家进行一次主板芯片组的年度全面回顾。主板芯片组并不是独立存在的一种硬件,每当有新主板发布,伴随其而来的也必将有新款的处理器&…

技嘉z68主板驱动下载地址

技嘉z68主板驱动下载地址 https://www.gigabyte.com/tw/Search?kwZ68 GA-Z68P-DS3 (rev. 2.1) Intel Z68 晶片組 驅動程式BIOS使用手冊支援列表CPU 支援列表工具程式 GA-Z68P-DS3 (rev. 2.0) Intel Z68 晶片組 驅動程式BIOS使用手冊支援列表CPU 支援列表工具程式 GA…

技嘉Z68升级UEFI BIOS后要注意的事项

1.慎用快速启动功能,我的Z68M-D2H开启了快速启动后USB供电不足,导至开机时键盘和鼠标都不能正常使用,当然也无法按delete键进入BIOS了。后来是通过长按电源键恢复的。 关闭快速启动 2.如果想设置管理员密码达到进入BIOS时才需要输…