英伟达用AI设计GPU:最新H100已经用上,比传统EDA减少25%芯片面积

news/2024/11/16 15:54:38/
白交 发自 凹非寺
量子位 | 公众号 QbitAI

英伟达终于揭晓:

H100竟有近13000条电路,是AI设计的?!

bdedbe77b13f29b9e14fd8bc3b30c93f.jpeg

在最新论文中,他们介绍了如何用深度强化学习agent设计电路的方法。

据研究人员称,这种方法还属业内首次。

1a28507c49990b7e05560929dcb42c8e.gif

值得一提的是,这篇文章包含参考文献在内,仅有短短6页。

不少网友表示,太酷了!

bb95d1156b114e5609568e37c3ed9bae.png

靠玩游戏来学习构建电路架

随着摩尔定律变慢,开发其他技术来提高芯片性能变得愈发重要。

设计更小、更快、功耗更低的算术电路,就是其中的方式之一。

基于这样的背景,研究人员提出了PrefixRL——用深度强化学习优化并行前缀电路。

e4f24710537abdd480047027dfc8ac1e.png

据研究人员介绍,他们不仅证明了AI可以从头开始设计电路,而且比EDA工具设计得更小、更快。

7c9ab4eccd23eefb938832b4578dfa4b.png

最新英伟达Hopper架构就拥有13000个AI设计电路的实例。

来具体看看这项研究。

本文主要研究了一种流行的并行前缀电路,着重讨论了电路的两大特性:电路面积和延迟。

已有的优化基本思路,是使用电路发生器将前缀图形转换为带有导线和逻辑门的电路,再用物理综合工具进一步优化。

他们将算术电路设计看作是一个强化学习任务,训练一个agent来优化两大特性。

对于前缀电路,还设计了一个环境。

b36ac0a83722bed74923595541c82cd6.png

在这个环境中agent玩构建电路架构(前缀图形)的游戏,可以从中添加or删除节点,会因为电路面积最小化和低延迟而获得奖励。

研究人员使用Q-Learning算法来训练agent。

首先将前缀图表示成网格,网格中的每个元素都映射到电路中的节点。

输入和输出均为网格,只不过输入网格中的每个元素表示节点是否存在,输出每个元素则表示用于添加或删除节点的Q值。

cfc9cc8b005b1b4a2fece3d98404534f.png

在实际训练中,PrefixRL是一项计算要求很高的任务:物理模拟每个GPU需要256个CPU,训练64b用例花费超32000个GPU小时。

为此,研究人员还开发了个分布式强化学习训练平台Raptor

24280ae0e952c21dbc3cade36432c15c.png

结果显示,在相同延迟、效能下PrefixRL加法器面积比EDA工具加法器面积减少了25%。

ad7d928837e09cf132fd56ed73f02293.gif

研究团队

本次研究来自英伟达应用深度学习研究小组。

他们希望这个方法有希望让AI应用到实际电路设计问题当中去。

近年来,AI设计芯片这件事儿很多科技公司都已经在展开。

最典型如谷歌,去年6月在Nature上发表了一篇文章:A graph placement methodology for fast chip design。

文中表示,AI能在6个小时内生成芯片设计图,而且比人类设计得更好。

de1e5dcc918b05015b58cbc80337a835.png

还有像三星、新思、cadence等企业也都有相应的解决方案。

前阵子在英伟达GTC大会上,首席科学家、计算机架构大师Bill Dally就分享了AI在芯片设计上的几种应用。

包括预测电压降、预测寄生参数、布局布线、自动化标准单元迁移。

不过,即便进展频频,也有不少质疑的声音出现,比如,设计能力跟人类比还差点。

对于AI设计芯片这事儿,你怎么看?

参考链接:
[1]https://developer.nvidia.com/blog/designing-arithmetic-circuits-with-deep-reinforcement-learning/
[2]https://arxiv.org/pdf/2205.07000.pdf
[3]https://twitter.com/rjrshr/status/1545446397759016962
[4]https://www.hpcwire.com/2022/04/18/nvidia-rd-chief-on-how-ai-is-improving-chip-design/


http://www.ppmy.cn/news/195401.html

相关文章

人工智能应用加持,戴尔科技升级混合办公新体验

什么才是企业员工最想要的智能办公装备?戴尔科技集团用自己最新发布的商用客户端产品,为我们给出了这个问题的答案。 全新升级的商用客户端产品 俗话说“工欲善其事,必先利其器”,对于企业员工来说,一款便利易用、智能…

BIOS介绍

目录 什么是BIOS BIOS中的程序 1)上电自检 1.1 什么是CMOS 1.2 CMOS RAM和BIOS的系统设置是什么关系呢? 1.3 主板给CMOS配了一块电池 1.4 这个阶段还看不到BIOS界面 2)系统启动自检程序: 2.1 设备驱动 2.2 操作系统的加载 3&…

SMBIOS介绍(1):概述

先介绍 DMI 。 DMI 是英文单词 Desktop Management Interface 的缩写,也就是桌面管理界面,它含有关于系统硬件的配置信息。计算机每次启动时都对 DMI 数据进行校验,如果该数据出错或硬件有所变动,就会对机器进行检测,并…

解决超微 SuperMicro 主板风扇反复高低转速

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 解决超微 SuperMicro 主板风扇反复高低转速 原因解决方案 在 X11 SSH-F 主板启动后,风扇有周期性的在低转速与最高转速之间切换。 原因 风扇正常工作时的转速低…

BIOS 的详细介绍

一、BIOS详解 对于不少新手,刷新BIOS还是比较神秘的。而对于一些BIOS相关的知识,不少人也是一知半解。在这里,我们将对BIOS作一次全面的了解。 1、什么是BIOS BIOS是英文"Basic Input Output System"的缩略语,直译过来…

【我所認知的BIOS】—The Big Real Mode

【我所認知的BIOS】—>The Big Real Mode LightSeed 2009-6-23 前面两篇,我们对实模式和保护模式做了比较详细地探讨,说了那么多其实都是为这篇文章服务的。因为在BIOS POST的过程中经常要用到1M以上的内存。但是BIOS本身的code却又都是在实…

关于IBM 3550 3650 3850 在BIOS设置legacy模式

1、在Boot Manager中,选择add Boot Option,选择legacy only 2、在Go to Boot Manager > Change Boot Order中,把legacy only选项添加到第一位。 3、commit changes ,保存

小白的proxmox ve(pve)打造AIO(all in boom)折腾日记 (四)硬件(显卡、硬盘、网卡)直通

硬件直通就是就是将自己主机的部分硬件直通到其中某一个虚拟机,其他虚拟机不能使用,这样可以有效的提升硬件使用性能。需要做的不算多,但是想要做好还是要下一定功夫,当时我也弄了很久,收藏夹里有很多文章,…