CUDA 参考文章

server/2024/12/23 4:40:56/

CUDA:NVCC编译过程和兼容性详解_nvcc把cuda代码转换成什么-CSDN博客icon-default.png?t=O83Ahttps://blog.csdn.net/fb_help/article/details/80462853

1、CUDA:NVCC编译过程和兼容性详解

 

CUDA:NVCC编译过程和兼容性详解
https://codeyarns.com/2014/03/03/how-to-specify-architecture-to-compile-cuda-code/
https://docs.nvidia.com/cuda/cuda-compiler-driver-nvcc/index.html#supported-phases

CUDA:NVCC编译过程和兼容性详解
前言
编译流程
一些基础知识
        GPU的“代”
        GPU的小“代”
应用程序的兼容性
        虚拟架构
        真实架构
提高兼容性的方式
        即时编译(Just-In-Time)
        Fatbinaries
–generate-code
        CUDA程序兼容性
总结
————————————————

                            版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
                        
原文链接:https://blog.csdn.net/fb_help/article/details/80462853

2、CUDA学习入门(二)(CUDA编译过程 & CUDA 线程层次)

虚拟架构代号    真实架构代号    CUDA支持版本    支持架构    支持硬件
compute_50    sm_50    CUDA 6~11    Maxwell    Tesla/Quadro M series
compute_52    sm_52    CUDA 6~11    Maxwell    GTX-980, GTX Titan X
compute_53    sm_53    CUDA 6~11    Maxwell    Tegra TX1, Jetson Nano
compute_60    sm_60    CUDA 8    Pascal    Tesla P100
compute_61    sm_61    CUDA 8    Pascal    GTX 1080, GTX1070
compute_62    sm_62    CUDA 8    Pascal    Jetson TX2
compute_70    sm_70    CUDA 9    Volta    Tesla V100
compute_72    sm_72    CUDA 9    Volta    Jetson AGX Xavier
compute_75    sm_75    CUDA 10    Turing    RTX 2080, RTX 2070 Tesla T4
compute_80    sm_80    CUDA 11.1    Ampere    A100
compute_86    sm_86    CUDA 11.1    Ampere    RTX 3090
compute_87    sm_87    CUDA 11.1    Ampere    Jetson AGX Orin
compute_89    sm_89    CUDA 11.8    Lovelace    RTX 4090
compute_90    sm_90    CUDA 12    Hopper    H100 H200
compute_95    sm_95    CUDA 12    Blackwell    B100
————————————————

我这里介绍的CUDA代码编译过程较为笼统,只是对大的过程进行概括,更加细节的可以参考下面这位大佬的文章:

https://blog.csdn.net/fb_help/article/details/80462853


                        
原文链接:https://blog.csdn.net/weixin_44222088/article/details/135716596


http://www.ppmy.cn/server/124750.html

相关文章

Unity 热更新(HybridCLR+Addressable)-安装配置HybridCLR+Addressable

一、安装HybridCLR 在https://hybridclr.doc.code-philosophy.com/官网中获取URL 下滑、复制链接在包管理器中下载 初始化,在unity菜单栏中点击HybridCLR下的Installer 安装成功后,会打印安装成功,并且会变成True 在Assets下创建文件夹&…

HTB:Three[WriteUP]

使用OpenVPN连接并启动机器 1.How many TCP ports are open? 使用nmap对靶机进行扫描:nmap -sV 10.129.233.85 可见仅开启了 22、80 共2个端口 2.What is the domain of the email address provided in the "Contact" section of the website? 直接对…

使用docker创建zabbix服务器

首先保证服务器已正常安装docker,然后执行下面这几个容器创建命令: #创建MySQL容器 docker run --name mysql-server -t --restartunless-stopped -e MYSQL_DATABASE"zabbix" -e MYSQL_USER"zabbix" -e MYSQL_PASSWORD"zabbix_…

经典sql题(十二)UDTF之Explode炸裂函数

1. EXPLODE: UDTF 函数 1.1 功能说明 EXPLODE 函数 是Hive 中的一种用户定义的表函数(UDTF),用于将数组或映射结构中的复杂的数据结构每个元素拆分为单独的行。这在处理复杂数据时非常有用,尤其是在需要将嵌套数据“打散”以便更…

大数据是不是需要用很多ip

在当今信息爆炸的时代,大数据技术已成为推动各行业发展的重要驱动力。随着数据量的激增和处理需求的增加,IP地址的使用在大数据环境中显得尤为重要。本文将探讨大数据是否需要使用多个IP地址,以及背后的原因。 什么是大数据? 大…

4--苍穹外码-SpringBoot项目中分类管理 详解

前言 1--苍穹外卖-SpringBoot项目介绍及环境搭建 详解-CSDN博客 2--苍穹外卖-SpringBoot项目中员工管理 详解(一)-CSDN博客 3--苍穹外卖-SpringBoot项目中员工管理 详解(二)-CSDN博客 4--苍穹外码-SpringBoot项目中分类管理 详…

【C语言刷力扣】1014.最佳观光组合

题目: 解题思路: 一开始对本题尝试两层for 循环遍历,时间复杂度为 , 超出时间限制,需要降低时间复杂度。 题目中求的组合得分可以分为 values[ i ] i 和 values[ j ] - j 两部分 要求得最高分即求 values[ i ] i 和…

9.28 daimayuan 模拟赛总结

感觉 -S 模拟赛时间好紧啊 复盘 8:00 开题 扫了一遍四道题,感觉 T1 很典,T2 有点神秘,T3 计数,但限制是简单的,看上去非常可做;T4 也有点神秘 推 T1,先定根,然后树形dp是显然的&…