OpenEuler Linux上怎么测试Nvidia显卡安装情况

devtools/2024/12/23 21:21:38/

当安装好显卡驱动后怎么样知道驱动程序安装好了,这里以T400 + OpenEuler 正常情况下,我们只要看一下nvidia-smi 状态就可以确定他已经正常了
如图:

这里就已经确定是可以正常使用了,这里只是没有运行对应的程序,那接来下我们就写一个测试程序来测试一下:以下代码通过AI给出然后做了一些小改

这里做两个文件:

首先,让我们创建一个C文件,命名为`gpu_matrix_multiply.cu`:

#include <stdio.h>
#include <stdlib.h>
#include <cuda_runtime.h>#define N 1024  // Matrix size (N x N)
#define BLOCK_SIZE 32__global__ void matrixMultiply(float *A, float *B, float *C) {int row = blockIdx.y * blockDim.y + threadIdx.y;int col = blockIdx.x * blockDim.x + threadIdx.x;float sum = 0.0f;if (row < N && col < N) {for (int i = 0; i < N; i++) {sum += A[row * N + i] * B[i * N + col];}C[row * N + col] = sum;}
}void initMatrix(float *matrix) {for (int i = 0; i < N * N; i++) {matrix[i] = rand() / (float)RAND_MAX;}
}int main() {float *h_A, *h_B, *h_C;float *d_A, *d_B, *d_C;size_t size = N * N * sizeof(float);// Allocate host memoryh_A = (float*)malloc(size);h_B = (float*)malloc(size);h_C = (float*)malloc(size);// Initialize host matricesinitMatrix(h_A);initMatrix(h_B);// Allocate device memorycudaMalloc(&d_A, size);cudaMalloc(&d_B, size);cudaMalloc(&d_C, size);// Copy host memory to devicecudaMemcpy(d_A, h_A, size, cudaMemcpyHostToDevice);cudaMemcpy(d_B, h_B, size, cudaMemcpyHostToDevice);// Define grid and block dimensionsdim3 dimBlock(BLOCK_SIZE, BLOCK_SIZE);dim3 dimGrid((N + dimBlock.x - 1) / dimBlock.x, (N + dimBlock.y - 1) / dimBlock.y);// Create CUDA events for timingcudaEvent_t start, stop;cudaEventCreate(&start);cudaEventCreate(&stop);// Record start eventcudaEventRecord(start);// Launch kernelmatrixMultiply<<<dimGrid, dimBlock>>>(d_A, d_B, d_C);// Record stop eventcudaEventRecord(stop);cudaEventSynchronize(stop);// Calculate elapsed timefloat milliseconds = 0;cudaEventElapsedTime(&milliseconds, start, stop);printf("Matrix multiplication took %f ms\n", milliseconds);// Copy result back to hostcudaMemcpy(h_C, d_C, size, cudaMemcpyDeviceToHost);// Clean upfree(h_A); free(h_B); free(h_C);cudaFree(d_A); cudaFree(d_B); cudaFree(d_C);cudaEventDestroy(start); cudaEventDestroy(stop);return 0;
}

然后能用批处理就批处理,再来创建一个Shell脚本来编译和运行这个程序。将以下内容保存为`compile_and_run.sh`:
 

#!/bin/bash# Compile the CUDA program
nvcc -o gpu_matrix_multiply gpu_matrix_multiply.cu# Check if compilation was successful
if [ $? -eq 0 ]; thenecho "Compilation successful. Running the program..."# Run the program./gpu_matrix_multiply
elseecho "Compilation failed."
fi

然后就是跑起来:
 

sh compile_and_run.sh

再开一个窗口来监控nvidia-smi 情况:
会看到如下结果:

这时Processes里多出来了刚才测试的程序.
测试完成.


http://www.ppmy.cn/devtools/144798.html

相关文章

shell脚本案例

脚本一&#xff1a;打印当前系统登录用户列表 #!/bin/bash # 使用 who 命令获取当前登录用户信息并输出 who解释&#xff1a;who 命令用于显示当前登录系统的用户信息&#xff0c;包括用户名、登录终端、登录时间等。此脚本直接执行 who 命令并将结果输出到终端。 脚本二&…

【漫话机器学习系列】012.深度学习(Deep Learning)基础

深度学习基础概述 深度学习&#xff08;Deep Learning&#xff09;是一种基于人工神经网络的大规模机器学习方法&#xff0c;在图像识别、语音处理、自然语言理解等领域具有广泛的应用。深度学习模型的构建包括数据准备、损失函数设计、优化算法选择、网络架构搭建、测试数据验…

NGINX的安装和配置(Linux环境)

目录 NGINX 安装方式1、 离线编译安装2、 在线仓库安装 NGINX 常用命令1、进程管理命令2、信息查看命令 NGINX 配置文件1、进程使用的配置2、配置文件格式3、配置文件层级 NGINX 全局配置1、全局配置常用指令2、连接相关配置 NGINX 配置MIME1、MIME 标准2、types 配置块3、defa…

springboot连接mongo性能优化参数配置

在 Spring Boot 中连接 MongoDB 时&#xff0c;性能优化是一个重要的环节。Spring Boot 提供了多种配置选项&#xff0c;可以通过调整这些参数来优化 MongoDB 的连接性能。以下是一些常见的性能优化参数及其配置建议。 1. 连接池配置 MongoDB 连接池的配置是性能优化的核心。通…

浏览器可以直接请求 websocket

一、原生支持 浏览器原生支持 WebSocket 协议&#xff0c;这使得开发者可以直接在 JavaScript 代码中使用 WebSocket 来建立与服务器的双向通信通道。 const socket new WebSocket("ws://localhost:8080");socket.addEventListener("open", function (e…

LeetCode---428双周赛

题目列表 3386. 按下时间最长的按钮 3387. 两天自由外汇交易后的最大货币数 3388. 统计数组中的美丽分割 3389. 使字符频率相等的最少操作次数 一、按下时间最长的按钮 题意要求找到按钮按下时间(即与它前一次按下按钮的时间差)最大的下标&#xff0c;如果存在两个相同的最…

【C语言1】C语言常见概念(总结复习篇)——库函数、ASCII码、转义字符

文章目录 前言一、C语言是什么&#xff1f;二、编译器的选择——VS2022三、main函数四、printf函数五、库函数六、关键字七、字符和ASCII编码八、字符串和\0九、转义字符十、注释总结 前言 上周考完四级(明年再战hh)和两门考试&#xff0c;接下来一个月将迎来其他学科的期末考…

Mac/Linux 快速部署TiDB

1.下载TiUP TiDB 是一个分布式系统。最基础的 TiDB 测试集群通常由 2 个 TiDB 实例、3 个 TiKV 实例、3 个 PD 实例和可选的 TiFlash 实例构成。通过 TiUP Playground&#xff0c;可以快速搭建出上述的一套基础测试集群&#xff0c;步骤如下&#xff1a; curl --proto https -…