Nsight System 下载
nsys
是 NVIDIA Nsight Systems 的命令行工具,可以用于分析 CUDA 应用程序的性能和行为。以下是在 Linux 上安装 nsys
的步骤:
- 下载 NVIDIA Nsight Systems 安装程序。您可以在 NVIDIA 的官方网站上下载适用于您的系统的安装程序。下载地址为:https://developer.nvidia.com/nsight-systems。
Nsight System 安装
-
安装 NVIDIA Nsight Systems。下载完成后,在终端中进入安装程序所在的目录,并执行以下命令以启动安装程序:
chmod +x <installer-name>.run ./<installer-name>.run
这将启动安装程序。您可以按照屏幕上的提示进行安装。
-
添加
nsys
到系统的 PATH 环境变量中。为了能够在终端中直接使用nsys
命令,您需要将安装目录中的bin
文件夹添加到系统的 PATH 环境变量中。可以使用以下命令将nsys
添加到 PATH 环境变量中:export PATH="/usr/local/cuda/Nsight_Systems_2021.4.1/bin:$PATH"
在这个命令中,
/usr/local/cuda/Nsight_Systems_2021.4.1/bin
是nsys
的安装路径,您需要将其替换为您的实际安装路径。
现在,您应该已经成功安装了 nsys
命令行工具。可以在终端中输入 nsys help
命令来查看所有可用的命令和选项。
Nsight System 调试
nsys profile python main.py
然后就会生成report1.qdstrm
和report1.sqlite
两个文件,将report1.qdstrm
转换为report1.qdrep
文件:
QdstrmImporter -i report1.qdstrm
最后将生成的 report1.qdrep
文件用 Nsight Systems 软件打开。
参考:https://blog.51cto.com/godweiyang/5516905
封面图:https://space.bilibili.com/189025925