A30、V100性能测试对比报告

news/2024/10/21 23:10:22/

一,基础配置对比

卡型架构卡数显存CUDAGPU Driver(TDP)能源消耗CPU核数(超线程)内存大小CPU型号发布日期备注
A30Ampere824G11.0450.51.06165 Watt48252AMD EPYC 7402 24-Core Processor2021PCIe
V100Volta832G11.4470.57.02250 Watt80503Intel® Xeon® Gold 6230 CPU @ 2.10GHz2017NV Link

二,模型训练对比

1,单卡模型训练对比

1.1, batch_size 为 128 对比
  • 对比环境
    在这里插入图片描述
  • 性能对比
    在这里插入图片描述
    在这里插入图片描述
    A30
    在这里插入图片描述
    V100
1.2,batch_size 为 256 对比
  • 对比环境
    在这里插入图片描述
  • 性能对比
    在这里插入图片描述
    在这里插入图片描述

2,多卡模型训练对比

2.1, batch_size 为 128 对比

  • 对比环境
    在这里插入图片描述
  • 性能对比
    在这里插入图片描述
    在这里插入图片描述

2.2, batch_size 为 256 对比

  • 对比环境
    在这里插入图片描述
  • 性能对比
    在这里插入图片描述

三,推理AB-压测对比

1,对比环境

共压80000数据,同时请求500数据。

2,压测性能对比

在这里插入图片描述

四,算力、带宽对比

A30参数
V100参数
在这里插入图片描述

A30:
在这里插入图片描述

V100:
在这里插入图片描述

注:

深入PCI与PCIe


http://www.ppmy.cn/news/283598.html

相关文章

MT7621_基础篇(1) 芯片资料了解 一

项目开发需要使用MT7621,负责驱动移植,适配公司板卡。网上相关资料多为涉及openwrt的,不太符合我们裁剪要求,故记录此流程,进行深入学习研究。首先先对芯片资源做一个了解。后续计划包括uboot移植分析,kern…

6230的GPRS上网设置

上GPRS只要设置正确,应该不存在软件的问题吧!功能表-服务-设置-连接设置-当前服务设置-选个空位-修改服务设置-设置组名称-“移动梦网GPRS”-主页-“http://wap.monternet.com”-代理-启动-主要代理-“10.0.0.172”-“80”-次要代理-空白-“8080”-传输方…

如何使用ebpf统计某个端口的流量

前言 上篇文章我们已经初步使用kprobe来探测内核函数了, 这篇文章就在上篇文章的基础上做个修改, 通过kprobe探测内核函数tcp_sendmsg来统计tcp服务端的发送流量. 废话不多说, 直接上正文. 环境 tcp服务端运行在ubuntu22, 监听端口为6230, 其内核为5.19.0-26-generic, ebpf程序…

【周赛318 LeetCode 6230】长度为 K 子数组中的最大和

题目描述 给你一个整数数组 nums 和一个整数 k 。请你从 nums 中满足下述条件的全部子数组中找出最大子数组和: 子数组的长度是 k,且子数组中的所有元素 各不相同 。返回满足题面要求的最大子数组和。如果不存在子数组满足这些条件,返回 0 …

pyinstaller OSError: could not get source code

pyinstaller打包pytorch框架分类模型报错, 报错:pyinstaller OSError: could not get source code 解决思路:网上大部分资料都是降低torchvision,然后继续解决新的报错,这里提供另一个思路,就是直接把报错…

osgi 学习系列(十一)非eclipse环境启动osgi配置

先说下bundle打jar包 选中要打包的bundle,export,在弹出的view中选中下图所示 在Destination中设置导出路径,Options修改如下,直接Finish即可 下面看下启动配置的目录结构 run.bat内容如下 java -Dosgi.noShutdowntrue -Dse…

Python基于指定范围筛选并剔除Excel表格中的数据

本文介绍基于Python语言,读取Excel表格文件,基于我们给定的规则,对其中的数据加以筛选,将不在指定数据范围内的数据剔除,保留符合我们需要的数据的方法。 首先,我们来明确一下本文的具体需求。现有一个Exce…

Linux ARM平台开发系列讲解(网络篇) 2.1 Marvell 88EA6321/6320 Switch 数据手册阅读之了解芯片功能

1. 概述 注意:88EA6321/88EA6320 和 88E6321/88E6320软件上无区别,区别在于硬件外围电源上 Marvell 88EA6321/88EA6320设备是一个集成了7端口千兆以太网交换机的单芯片,带有两个集成的千兆以太网收发器。该设备支持最新的IEEE 802.1音频视频桥接(AVB)标准。这些设备使用这…