AI 编译器学习笔记之四 -- cann接口使用

devtools/2024/10/20 10:59:41/

1、安装昇腾依赖

# CANN发布件地址

https://cmc.rnd.huawei.com/cmcversion/index/releaseView?deltaId=10274626629404288&isSelect=Software&url_data=run

Ascend-cann-toolkit_8.0.T15_linux-aarch64.run

Ascend-cann-nnal_8.0.T15_linux-aarch64.run

Ascend-cann-kernels-910b_8.0.T15_linux.run

# torch_npu (注意版本匹配,torch版本为2.1.0)

https://cmc-szv.clouddragon.huawei.com/cmcversion/index/releaseView?deltaId=10365017745917184&isSelect=Inner

pip install torch_npu-2.1.0.post6.dev20240716-cp310-cp310-manylinux_2_17_aarch64.manylinux2014_aarch64.whl

# 下载NLTK data, 参考 https://blog.csdn.net/u010099177/article/details/102900515

# 将nltk_data放到对应conda目录下

2、cann迭代更新非常快,因此查阅时注意版本号的选择

简介-性能分析工具-训练推理开发工具-开发工具-CANN商用版8.0.RC2开发文档-昇腾社区

3、采用优先使用msprof, 但是需要安装Ascend-cann-tookit开发套件包

分包安装: bash Ascend-cann-toolkit_8.0.RC2_linux-aarch64.run --install --install-path=/pathdir

msprof --application="run yourApp" --output=./profile --ascendcl=on --model-execution=on --runtime-api=on --task-time=on --aicpu=on --ai-core=on --aic-mode=task-based --aic-metrics=PipeUtilization --sys-hardware-mem=on

 Ascend PyTorch Profiler接口采集-使用PyTorch框架接口采集-其他采集方式介绍-性能分析工具-开发工具-CANN社区版8.0.RC2.alpha001开发文档-昇腾社区 (hiascend.com)

.json文件可以通过chrome://tracing/打开,W-放大,S-缩小,A-向左,D-向右 

4、社区地址及最新资源

           昇腾开发者社区:昇腾社区官网-昇腾万里 让智能无所不及

           gitee社区:Ascend: 昇腾万里,让智能无所不及

           昇腾论坛:https://www.hiascend.com/forum/forum-0163125572293226003-1.html

           Ascend C聚合页:昇腾Ascend C-昇腾社区

           CANN社区版软件包:昇腾社区-官网丨昇腾万里 让智能无所不及

           Ascend C开发者文档:Ascend C简介-Ascend C算子开发-算子开发-CANN社区版8.0.RC3.alpha003开发文档-昇腾社区


http://www.ppmy.cn/devtools/127268.html

相关文章

cisco网络安全技术第3章测试及考试

测试 使用本地数据库保护设备访问(通过使用 AAA 中央服务器来解决)有什么缺点? 试题 1选择一项: 必须在每个设备上本地配置用户帐户,是一种不可扩展的身份验证解决方案。 请参见图示。AAA 状态消息的哪一部分可帮助…

计算机前沿技术-人工智能算法-大语言模型-最新研究进展-2024-10-18

计算机前沿技术-人工智能算法-大语言模型-最新研究进展-2024-10-18 目录 文章目录 计算机前沿技术-人工智能算法-大语言模型-最新研究进展-2024-10-18目录1. On the Reliability of Large Language Models to Misinformed and Demographically-Informed Prompts2. SafeLLM: Dom…

【网络安全】CVE-2024-46990: Directus环回IP过滤器绕过实现SSRF

未经许可,不得转载。 文章目录 背景漏洞详情受影响版本解决方案背景 Directus 是一款开源 CMS,提供强大的内容管理 API,使开发人员能够轻松创建自定义应用程序,凭借其灵活的数据模型和用户友好的界面备受欢迎。然而,Directus 存在一个漏洞,允许攻击者绕过默认的环回 IP …

vscode中关闭cmake自动配置

前言 最近误触了一个操作,导致,一旦使用vscode打开项目,就会去配置cmake。或者你一旦更改cmakelists.txt,就会去配置cmake。 这个操作,结果对不对还另说,关键是增加计算机开销,使得vscode打开后…

数据结构--栈和队列

目录 1.栈(Stack)1.1 介绍1.2 栈的实现1.2.1 模拟实现栈1.2.2 Stack类实现 1.3 栈的常用方法1.4 栈,虚拟机栈和栈帧的区别 2.队列(Queue)2.1 介绍2.2 队列的实现2.2.1 模拟实现队列2.2.2 Queue接口实现 2.3 队列的常用方法 1.栈(Stack) 1.1 介绍 栈是一种特殊的线…

MAC地址漂移实验

MAC地址漂移实验的概述: MAC地址漂移实验的概述主要围绕网络设备中的MAC地址动态变化及其检测与防护措施。以下是对MAC地址漂移实验的具体介绍: MAC地址漂移的定义:MAC地址漂移是指在同一个VLAN内,一个MAC地址被交换机的两个不同…

【二刷hot-100】day 3

目录 1.最小覆盖子串 2.二叉树展开为链表 3.面试题 17.14. 最小K个数 1.最小覆盖子串 class Solution {public String minWindow(String s, String t) {char [] s1s.toCharArray();int ms1.length;int retleft-1;int retrightm;int [] cntsnew int[128];int [] cnttnew int…

web前端网页用户注册页面

源码&#xff1a; <head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0"><title>用户注册</title> </head> <body><form action"#" metho…