Nvidia BF3 DPU安装

server/2024/11/30 0:41:51/

参考链接:https://docs.nvidia.com/doca/archive/doca-v2-5-0/nvidia+doca+developer+quick+start+guide/index.html

DPU_2">安装DPU硬件

参考链接:https://docs.nvidia.com/networking/display/bluefield2dpuenug/hardware+installation

断电、插网卡

卸载之前的驱动

后续卸载之前驱动、配置Host环境、配置DPU环境等,均按照下方参考链接来配置,其中的版本好、.deb文件的选择,也都是根据系统,按照其中的表格来进行选择的。

需要注意的是,因为安装的ubuntu系统为18.04,所以与其相匹配的最大doca环境是2.5,因此没有选择最新的doca2.6进行配置

参考链接:https://docs.nvidia.com/doca/archive/doca-v2-5-0/nvidia+doca+installation+guide+for+linux/index.html#src-2448907425_NVIDIADOCAInstallationGuideforLinux-BuildingYourOwnBFBInstallationImage

for f in $( dpkg --list | grep doca | awk '{print $2}' ); do echo $f ; apt remove --purge $f -y ; done
ofed_uninstall.sh --force
sudo apt-get autoremove
wget http://www.mellanox.com/downloads/ofed/RPM-GPG-KEY-Mellanox-SHA256
sudo apt install rpm
sudo rpm --import RPM-GPG-KEY-Mellanox-SHA256
rpm -q gpg-pubkey --qf '%{NAME}-%{VERSION}-%{RELEASE}\t%{SUMMARY}\n' | grep Mellanox

在Host上安装DOCA

找到系统版本所对应的DOCA安装文件(我的是ubuntu18.04版本的OS):

在这里插入图片描述

解压缩:

sudo dpkg -i doca-host-repo-ubuntu1804_2.5.0-0.0.1.2.5.0108.1.23.10.1.1.9.0_amd64.deb

在这里插入图片描述
更新镜像:

sudo apt-get update

安装doca-tools:

sudo apt install doca-tools

通过下面命令启动mst,并获取DPU的device id:

mst start
mst status -v

在这里插入图片描述

/dev/mst/mt41692_pciconf0.1 就是device id。

安装:

sudo apt install -y doca-runtime doca-sdk doca-tools

在这里插入图片描述

在这里插入图片描述

sudo mlxconfig -d /dev/mst/mt41692_pciconf0.1 -y reset
sudo mlxconfig -d /dev/mst/mt41692_pciconf0.1 -e q | grep -i link_type

在这里插入图片描述
Verify that RShim is active

sudo systemctl status rshim

在这里插入图片描述

sudo apt install -y doca-ofed
sudo mst start
sudo mlxconfig -d /dev/mst/mt41692_pciconf0.1 -y reset

Assign a dynamic IP to tmfifo_net0 interface (RShim host interface).

ifconfig tmfifo_net0 192.168.100.1 netmask 255.255.255.252 up

DPUbfb_ubuntu_125">在DPU上安装bfb ubuntu镜像

安装pv

sudo apt-get install pv
sudo bfb-install --rshim rshim0 --bfb DOCA_2.5.0_BSP_4.5.0_Ubuntu_22.04-1.23-10.prod.bfb --config bf.cfg

验证:

ls -la /dev/ | grep rshim

连接DPU

ssh ubuntu@192.168.100.2

然后输入密码sdn123456

查看DPU上OS版本信息:

cat /proc/version

DPU侧安装:

root@server11:/home/sdn/YFman/BF3/deb# sudo scp -r doca-dpu-repo-ubuntu2204-local_2.5.0107-1.23.10.1.2.0.0.bf.4.5.0.12993_arm64.deb ubuntu@192.168.100.2:/tmp/

http://www.ppmy.cn/server/15051.html

相关文章

记一次etcd数据恢复

使用官方示例 etcd:image: bitnami/etcd:3.4.15restart: alwaysvolumes:- ./etcd_data:/bitnami/etcdenvironment:ALLOW_NONE_AUTHENTICATION: "yes"ETCD_ADVERTISE_CLIENT_URLS: "http://etcd:2379"ETCD_LISTEN_CLIENT_URLS: "http://0.0.0.0:2379…

go热更新配置文件

使用go开发的时候是不是大家都遇到过,更改完配置之后需要重新启动自己的服务,会导致短暂的访问不到的效果,今天就给大家分享一个go热更新配置文件的小例子,让你不用停服务的情况也能加最新的配置文件,请看下面代码 fu…

Python 全栈安全(一)

原文:annas-archive.org/md5/712ab41a4ed6036d0e8214d788514d6b 译者:飞龙 协议:CC BY-NC-SA 4.0 前言 序言 多年前,我在亚马逊搜索了一本基于 Python 的应用程序安全书。我以为会有多本书可供选择。已经有了很多其他主题的 Pyt…

yolov8缺陷检测改进步骤

yolov8改进步骤 1.看视频:parse 2.修改fitness()函数 位置:ultralytics/utils/metrics.py 检索fitness(self) def fitness(self):"""Model fitness as a weighted combination of metrics."""w [0.0, 1.0, 0.0, 0.0] # weights f…

同一工程中不同RS的问题结论

目录 MeshDevice/deviceAll && /wvp/device ​编辑 故意改成mesh下的RS,结果包裹了: sys2/redishealth ​编辑 ​编辑 原因解析 MeshDevice/deviceAll && /wvp/device 测试结果:都使用 import com.gbcom.wvp.domain.vo.RS; 返…

UE5 GAS开发P34 游戏效果理论

GameplayEffects Attributes(属性)和Gameplay Tags(游戏标签)分别代表游戏中实体的特性和标识。 Attributes(属性):Attributes是用来表示游戏中实体的特性或属性的值,例如生命值、…

【SolidWorks多种安装错误解决教程】

sw卸载重装教程 SolidWorks也就是sw每次重装或者新电脑安装都出问题,这次大概做一个汇总,如有其他问题可以评论让我加上。 AutoRemove一键卸载工具 autoremove有清理solidworks的功能,如图,先登录,登录之后点击清理卸载…

[InternLM训练营第二期笔记]6.Lagent AgentLego 智能体应用搭建

该系列是上海AI Lab举行的书生 浦语大模型训练营的相关笔记部分。 该笔记是第六节课,学习大语言模型智能体的基本概念,以及Lagent的使用。 0. 智能体 在大型语言模型(LLM)的上下文中,智能体(agent&#xf…