模型和算力看板:Compute DashBoard

embedded/2024/9/25 8:58:12/

AGI 之路

AGI(通用人工智能)是整个计算机科学的圣杯,算力的增长和模型能力的提升(算法和数据)缺一不可。作为一个新质生产力,构建一个合理的评价体系是常用的方法论。针对模型和算力的评价,有类似MLPerf 这样的第三方评价组织, 但其数据主要依赖各个厂家进行提交,包含单机和服务器的各项指标,通常很难比较单一GPU或者单一模型的各项能力。

我们在选择云服务或者单机服务器时,基于现有模型如何匹配合适的算力,通常是一件糟心的事情,考虑到算力的昂贵,需要物尽其用,综合考虑现存/算力/带宽/散热 等影响因子。Compute DashBoard 从算力的角度出发,整理了各家国内外数据中心推理训练卡的各项参数,囊括了包含封装,互联以及算力指标等性能参数,可以为模型部署提供参考,同时如果你是一个芯片行业从业者,从产品角度,提供了一个竞品的功能和性能参考。

除此之外,Compute DashBoard 还提供了各个主流LLM开源模型在不同参数匹配情况下的Performance Benchmark, 包括首字延时/平均延时和吞吐。

使用指引

访问Compute DashBoard 网站:ostring.streamlit.app
在这里插入图片描述

进入主页后,Home 页是一个GPU Evolution 的Timeline 页面,希望呈现出各个阶段代表性的GPU 产品,AIGC 作为一个时代的Milestone, 产品也应该有它自己的Milestone,持续进化中。
在这里插入图片描述

GPUs 页面,我们可以选择芯片厂商,同时在对应的列表中选择支持的加速器产品
在这里插入图片描述

Models页面,目前支持市面上绝大多数开源的LLM模型,基于GPU 的性能数据,我们以柱状图的形式展示其在不同的GPU 平台上的延时和吞吐数据。

在这里插入图片描述

访问申请

Compute DashBoard 基于streamlit 作为开发框架快速搭建,基于streamlit community cloud进行部署。

  • step1: 登录streamlit cloud注册一个账号
    在这里插入图片描述

  • step2: 关注微信公众号OString2024或者CSDN OString2024,后台私信您的streamlit 账号(邮箱号:xxxx@xxx.com)
    在这里插入图片描述

  • step3: 博主在后台添加对应账号即可访问:ostring.streamlit.app

由于模型性能数据均由个人租用真实GPU来进行性能读出并整理至数据库,租用GPU会产生一定费用, 因此访问申请会逐渐放开,或者考虑收取少量费用,敬请了解。

期待

欢迎大家后台反馈你们的需求。
后续还会持续上线:

  • Diffusion/VIT 模型的benchmark;
  • 充实GPU 家族
  • 各厂家MLPerf 的性能结果

http://www.ppmy.cn/embedded/108088.html

相关文章

005:VTK世界坐标系中的相机和物体

VTK医学图像处理---世界坐标系中的相机和物体 左侧是成像结果 右侧是世界坐标系中的相机与被观察物体 目录 VTK医学图像处理---世界坐标系中的相机和物体 简介 1 在三维空间中添加坐标系 2 世界坐标系中的相机 3 世界…

Vue2 中对数组进行操作时需要注意什么

在 Vue 2 中,对数组进行操作时有一些需要特别注意的地方,以确保 Vue 的响应式系统能够正确地检测和反应数据的变化。由于 Vue 2 的响应式系统是基于 Object.defineProperty 实现的,处理数组时存在一些限制和注意事项。以下是一些关键点&#…

Android Studio调试Flutter项目

run运行项目中途,点击Flutter Attach 等一会就可以调试! 或者,直接Debug允行项目。

log4j 同一线程隔离classloader下MDC信息不同问题解决 ThreadLocal问题分析

最近遇到日志文件记录错误的问题。一个任务的日志信息会被莫名的拆分到两个不同目录中。且有一个目录还是曾经执行过的任务的目录。经过分析,首先怀疑的是MDC没有清理的问题,这也是最直观的问题。因为任务是在线程池(fixedThreadPool)中运行的。由于线程…

25版王道数据结构课后习题详细分析 第六章 图 6.4图的应用

一、单项选择题 ———————————————————— ———————————————————— 解析: 当无向连通图存在权值相同的多条边时,最小生成树可能是不唯一的;另外,由于这是一个无向连通图,因此最小生成树必定…

什么是网络准入控制系统?网络准入控制系统七大品牌介绍!

在当今信息化时代,企业网络安全面临着前所未有的挑战。网络准入控制系统(NAC, Network Access Control)作为一种重要的网络安全技术,扮演着守护企业网络安全大门的关键角色。网络准入控制系统通过对接入网络的设备进行身份验证、安…

kafka及异步通知文章上下架

1)自媒体文章上下架 需求分析 2)kafka概述 消息中间件对比 特 性 ActiveMQ RabbitMQ RocketMQ Kafka 开 发 语 言 java erlang java scala 单 机 吞 吐 量 万级 万级 10万级 100万级 时 效 性 ms us ms ms级以内 可 用 性 高(主从&#xff0…

项目实战 ---- 商用落地视频搜索系统(5)---service层核心

目录 背景 向下service 层 描述 功能 代码实现 核心阐述 向上service层 描述 功能 代码实现 核心阐述 背景 之前的 1-4 重点在介绍系统的实现架构,录入数据的组织形式,存储模式,search 方式,以及后期算法等。重点都是聚焦在后端。现在来看,基本的后端实现我们…