Nvidia BF3 DPU安装

ops/2025/3/20 14:19:31/

参考链接:https://docs.nvidia.com/doca/archive/doca-v2-5-0/nvidia+doca+developer+quick+start+guide/index.html

DPU_2">安装DPU硬件

参考链接:https://docs.nvidia.com/networking/display/bluefield2dpuenug/hardware+installation

断电、插网卡

卸载之前的驱动

后续卸载之前驱动、配置Host环境、配置DPU环境等,均按照下方参考链接来配置,其中的版本好、.deb文件的选择,也都是根据系统,按照其中的表格来进行选择的。

需要注意的是,因为安装的ubuntu系统为18.04,所以与其相匹配的最大doca环境是2.5,因此没有选择最新的doca2.6进行配置

参考链接:https://docs.nvidia.com/doca/archive/doca-v2-5-0/nvidia+doca+installation+guide+for+linux/index.html#src-2448907425_NVIDIADOCAInstallationGuideforLinux-BuildingYourOwnBFBInstallationImage

for f in $( dpkg --list | grep doca | awk '{print $2}' ); do echo $f ; apt remove --purge $f -y ; done
ofed_uninstall.sh --force
sudo apt-get autoremove
wget http://www.mellanox.com/downloads/ofed/RPM-GPG-KEY-Mellanox-SHA256
sudo apt install rpm
sudo rpm --import RPM-GPG-KEY-Mellanox-SHA256
rpm -q gpg-pubkey --qf '%{NAME}-%{VERSION}-%{RELEASE}\t%{SUMMARY}\n' | grep Mellanox

在Host上安装DOCA

找到系统版本所对应的DOCA安装文件(我的是ubuntu18.04版本的OS):

在这里插入图片描述

解压缩:

sudo dpkg -i doca-host-repo-ubuntu1804_2.5.0-0.0.1.2.5.0108.1.23.10.1.1.9.0_amd64.deb

在这里插入图片描述
更新镜像:

sudo apt-get update

安装doca-tools:

sudo apt install doca-tools

通过下面命令启动mst,并获取DPU的device id:

mst start
mst status -v

在这里插入图片描述

/dev/mst/mt41692_pciconf0.1 就是device id。

安装:

sudo apt install -y doca-runtime doca-sdk doca-tools

在这里插入图片描述

在这里插入图片描述

sudo mlxconfig -d /dev/mst/mt41692_pciconf0.1 -y reset
sudo mlxconfig -d /dev/mst/mt41692_pciconf0.1 -e q | grep -i link_type

在这里插入图片描述
Verify that RShim is active

sudo systemctl status rshim

在这里插入图片描述

sudo apt install -y doca-ofed
sudo mst start
sudo mlxconfig -d /dev/mst/mt41692_pciconf0.1 -y reset

Assign a dynamic IP to tmfifo_net0 interface (RShim host interface).

ifconfig tmfifo_net0 192.168.100.1 netmask 255.255.255.252 up

DPUbfb_ubuntu_125">在DPU上安装bfb ubuntu镜像

安装pv

sudo apt-get install pv
sudo bfb-install --rshim rshim0 --bfb DOCA_2.5.0_BSP_4.5.0_Ubuntu_22.04-1.23-10.prod.bfb --config bf.cfg

验证:

ls -la /dev/ | grep rshim

连接DPU

ssh ubuntu@192.168.100.2

然后输入密码sdn123456

查看DPU上OS版本信息:

cat /proc/version

DPU侧安装:

root@server11:/home/sdn/YFman/BF3/deb# sudo scp -r doca-dpu-repo-ubuntu2204-local_2.5.0107-1.23.10.1.2.0.0.bf.4.5.0.12993_arm64.deb ubuntu@192.168.100.2:/tmp/

http://www.ppmy.cn/ops/15031.html

相关文章

【深度学习】Dropout、DropPath

一、Dropout 1. 概念 Dropout 在训练阶段会让当前层每个神经元以drop_prob( 0 ≤ drop_prob ≤ 1 0\leq\text{drop\_prob}\leq1 0≤drop_prob≤1)的概率失活并停止工作,效果如下图。 在测试阶段不会进行Dropout。由于不同批次、不同样本的神…

【堆】Leetcode 347. 前 K 个高频元素【中等】

前 K 个高频元素 给你一个整数数组 nums 和一个整数 k ,请你返回其中出现频率前 k 高的元素。你可以按 任意顺序 返回答案。 示例 1: 输入: nums [1,1,1,2,2,3], k 2 输出: [1,2] 解题思路 1、使用哈希表来统计数组中每个元素的出现频率。2、使用最小堆&…

阿里云难题学习笔记

1、下列内存区段增长方是向低地址方向的有( )? A: 文本段 B: 数据段 C: 堆区 D: 栈区 解析: 在内存管理中,不同的内存区段增长方向是不同的。栈区(Stack)的增长方向是向低地址方向的&…

Web集群_02

Web集群_01 Keepalived 概述 Keepalived实现了高可用集群 Keepalived最初是为LVS设计 , 专门监控各种服务器节点的状态 Keepalived 后加入了 VRRP 功能 , 防止单点故障 VRRP ( 虚拟冗余路由协议 ) VRRP能在不改变网组的情况下 , 将多台路由器虚拟成一个虚拟路由器 , 通过配…

书生·浦语大模型实战营之Llama 3 高效部署实践(LMDeploy 版)

书生浦语大模型实战营之Llama 3 高效部署实践(LMDeploy 版) 环境,模型准备LMDeploy chatTurmind和Transformer的速度对比LMDeploy模型量化(lite)LMDeploy服务(serve) 环境,模型准备 InternStudio 可以直接使用 studio-conda -t …

Golang实现一个批量自动化执行树莓派指令的软件(3)下载

简介 话接上篇 Golang实现一个批量自动化执行树莓派指令的软件(2)指令, 这次实现文件的下载。 环境描述 运行环境: Windows, 基于Golang, 暂时没有使用什么不可跨平台接口, 理论上支持Linux/MacOS 目标终端:树莓派Debi…

【 Vue 路由 跳转 路由守卫 】

Vue Router replace 编程式导航缓存路由组件 路由跳转的replace方法 作用:控制路由跳转时操作浏览器历史记录的模式浏览器的历史记录有两种写入方式:push 和 replacereplace是替换当前记录,路由跳转时候默认为push方式 replace 标签写法 : &…

【每日一题】2007. 从双倍数组中还原原数组-2024.4.18

题目: 2007. 从双倍数组中还原原数组 一个整数数组 original 可以转变成一个 双倍 数组 changed ,转变方式为将 original 中每个元素 值乘以 2 加入数组中,然后将所有元素 随机打乱 。 给你一个数组 changed ,如果 change 是 双…