GPU计算

news/2024/12/3 7:55:44/

文章目录

  • GPU计算
    • 1. GPU和CPU的区别
    • 2. GPU的主要参数解读
    • 3. 如何在pytorch中使用GPU
    • 4. 市面上主流GPU的选择

GPU计算

1. GPU和CPU的区别

设计目标不同,CPU基于低延时,GPU基于高吞吐。

  • CPU:处理各种不同的数据类型,同时又要逻辑判断又会引入大量的分支跳转和中断的处理
  • GPU:处理类型高度统一的、相互无依赖的大规模数据,不需要被打断的纯净的计算环境

什么类型的程序适合在GPU上运行?

  • 计算密集型
  • 易于并行的程序

2. GPU的主要参数解读

  1. 显存大小:当模型越大或者训练时的批量越大时,所需要的显存就越多。
  2. FLOPs:每秒浮点运算次数(亦称每秒峰值速度)是每秒所运行的浮点运算次数(英语:Floating-point operations per second;缩写:FLOPS)的简称,被用来估算电脑性能,尤其是在使用到大量浮点运算的科学计算领域中。
  3. 显存带宽:显存在一个时钟周期内所能传送数据的位数;位数越大则瞬间所能传输的数据量越大。

3. 如何在pytorch中使用GPU

  1. 模型转为cuda
  2. 数据转为cuda
  3. 输出数据去cuda,转为numpy

在这里插入图片描述

在这里插入图片描述

如果有可用的数个GPU:可以设置dev="cuda:0"或dev="cuda:1"。需要注意的是,如果使用多卡进行训练和预测,可能会出现部分计算结果丢失的情况。在有GPU条件下,可以尝试“训练用单卡,预测用多卡”、“训练用多卡、预测用单卡”等几种情况下的结果。

4. 市面上主流GPU的选择

参考:https://www.bybusa.com/gpu-rank

https://zhuanlan.zhihu.com/p/61411536

http://timdettmers.com/2020/09/07/which-gpu-for-deep-learning/

使用主机机箱配置或者(云)服务器,不要使用笔记本。

入门免费:Colab,Kaggle(RTX 2070)

针对不同深度学习架构,GPU参数的选择优先级是不一样的,总体来说分两条路线:

卷积网络和Transformer:张量核心>FLOPs(每秒浮点运算次数)>显存带宽>16位浮点计算能力

循环神经网络:显存带宽>16位浮点计算能力>张量核心>FLOPs

欢迎各位关注我的个人公众号:HsuDan,我将分享更多自己的学习心得、避坑总结、面试经验、AI最新技术资讯。


http://www.ppmy.cn/news/307002.html

相关文章

浅析GPU计算——CPU和GPU的选择

目前市面上介绍GPU编程的博文很多,其中很多都是照章宣科,让人只能感受到冷冷的技术,而缺乏知识的温度。所以我希望能写出一篇可以体现技术脉络感的文章,让读者可以比较容易理解该技术,并可以感悟到cuda编程设计及优化的…

Matlab 并行计算学习初步

Matlab 并行计算学习 1. 简介 高性能计算(High Performance Computing,HPC)是计算机科学的一个分支,研究并行算法和开发相关软件,致力于开发高性能计算机。可见并行计算是高性能计算的不可或缺的重要组成部分。 1.1 并行计算 并行计算&am…

什么是GPU计算

什么是GPU计算 Nvidia公式发布了了CUDA,它是建立在NVIDA的CPUs上的一个通用并行计算平台和编程模型,基于CUDA编程可以利用GUPs的并行计算引擎来更加高效地解决比较复杂的计算难题GPU并不是一个独立运行的计算平台,而需要与CPU协同工作&#…

Apache Hudi初探(九)(与spark的结合)--非bulk_insert模式

背景 之前讨论的都是’hoodie.datasource.write.operation’:bulk_insert’的前提下,在这种模式下,是没有json文件的已形成如下的文件: /dt1/.hoodie_partition_metadata /dt1/2ffe3579-6ddb-4c5f-bf03-5c1b5dfce0a0-0_0-41263-0_202305282…

一个关于宏定义的问题,我和ChatGPT、NewBing、Google Bard、文心一言 居然全军覆没?

文章目录 一、问题重述二、AI 解题2.1 ChatGPT2.2 NewBing2.3 Google Bard2.4 文心一言2.5 小结 一、问题重述 今天在问答模块回答了一道问题,要睡觉的时候,又去看了一眼,发现回答错了。 问题描述:下面的z的值是多少。 #define…

JSP+SQL网上书店销售系统(论文+系统)

本次毕业设计的题目就是网上书店系统。 本论文就毕业设计的内容,系统地阐述了整个网上书店系统的功能及实现。我们小组人员在指导老师的带领下设计并实现了从商品管理,商品分类和查询,到购物车实现,用户订单处理,再到聊天室,管理员系统。基本上实现了电子商务的功能流程…

15 笔记本电脑进入BIOS/EFI方式汇总

BIOS即基本输入输出系统【Basic Input Output System】,是个人电脑启动之时加载的第一个软件。人为可以设置BIOS,而设置BIOS中的虚拟化开关也是电脑装VMware等虚拟化软件的必要步骤。与BIOS类似的还有一个是EFI【可扩展固件接口 Extensible Firmware Int…

dell n5110 触摸板驱动

http://ftp.dell.com/input/R305170.exe 从这个地址下载安装文件,安装重启