异构加速在加速什么

news/2024/11/23 5:06:31/

目前市面上的加速芯片挺多的,比如GPU、FPGA、TPU,以及针对各种特殊应用所开发的加速芯片。自己一直想理清楚这些加速芯片到底在加速什么,一直没有确切答案。一般宽泛的说法是CPU处理效率较低的,我们就进行加速,但个人觉得应该有些更本质的东西。以下是最近个人的一些感悟。

       加速其实都是针对CPU而言,而CPU中一般最消耗资源的部分可以认为是循环计算,因此加速是针对这些循环部分做加速。我们大的可以分为IO的加速以及计算部分的加速。

       计算加速,以下是一些例子:

1) 比如图像与视频这种针对像素的处理,每个像素块处理的基本步骤都是一致的,但像素的数量巨大因此是一种循环的加速。

2) 神经网络元运算的加速,无论是推理还是训练,其实针对每个神经元的运算也是重复的乘加运算。

3) 查表算法以及各种匹配算法,这块虽然可以看作循环运算,但在循环体内部其实反而是比较复杂的,因此加速时设计的硬件结构反而是比较复杂的。

IO加速:

最简单的可以看网卡芯片,因为报文是重复来的,并且处理的步骤也差不多,大体上也是可以看作循环处理,只是循环的内部的处理步骤比较多而已。

从上面分析可知,异构加速时,实际上是设计一种高效的硬件处理结构,这种处理结构可以针对不同的循环进行加速,因此循环体不同,要设计的硬件结构也不同,就不存在某种通用的硬件加速器了。除了这个处理循环的加速单元,加速芯片还应该加上必要的控制电路以及与主芯片的互联电路。

要将这些异构加速器连接在一起,就需要设计一种高效的互联结构。这个互联结构需要低延迟高吞吐,以及在这之上设计的异构芯片逻辑交互流程,这个目前一般可以认为是DMA。之前我们对DMA的认识一般限制在降低CPU利用率上,但其实他有一个更重要的作用,就是提供异构芯片之间高效的互联机制,因此针对不同的场景这个DMA的要求是不一样的。这个留待下周总结吧,一周总结一点点,没那么累哈。



http://www.ppmy.cn/news/455572.html

相关文章

英特尔助力快手实现异构计算加速 显著提升性能,降低系统TCO

昨晚睡得好吗?睡不好可以刷快手的《11 点睡吧》。这部当代人睡眠困境的微综艺,总曝光量达到 107亿,不但科普睡眠知识,更深度探讨都市人的喜怒哀乐[1]。惊人的曝光量背后,是快手对用户画像数据的精准分析,离…

深入理解CPU和异构计算芯片GPU/FPGA/ASIC

转自,http://www.cnblogs.com/qcloud1001/p/6617764.html 随着互联网用户的快速增长,数据体量的急剧膨胀,数据中心对计算的需求也在迅猛上涨。诸如深度学习在线预测、直播中的视频转码、图片压缩解压缩以及HTTPS加密等各类应用对计算的需求已…

异构计算(Heterogeneous Compute)

1. 异构计算接口 1) RenderScript(GPU计算): 它是官方异构计算的Android API&#xff0c;从Android ICS 4.2开始&#xff0c;它启用GPU来进行计算&#xff1b;它实现了20多个滤波器(filters)&#xff0c;支持CPU和GPU&#xff0c;且针对Mali-T600进行了优化。 (Nexus 10 <Ma…

异构计算技术分析

异构计算技术分析 参考文献链接 https://mp.weixin.qq.com/s/xW_Y0JBKK3d42IZvHA9CrQ https://mp.weixin.qq.com/s/amQj0DYvs9QwIuTpsGEFNg https://mp.weixin.qq.com/s/Y2cRAHnztWw5l0eeU_pDrg https://mp.weixin.qq.com/s/WyVgGB8-dPl9L68cppUNaw 什么是异构计算&#xff1f;…

再谈异构计算CPU+GPU

异构计算的英文名称是Heterogeneous computing&#xff0c;主要是指使用不同类型指令集和体系架构的计算单元组成系统的计算方式。常见的计算单元类别包括CPU、GPU等协处理器、DSP、ASIC、FPGA等。我们常说的并行计算正是异构计算中的重要组成部分异构计算近年来得到更多关注&a…

基于CPU+GPU的异构计算

GPU GPU是为了视频游戏而产生的&#xff08;至今其主要驱动力还是不断增长的视频游戏市场&#xff09;&#xff0c;在三维游戏中常常出现的一类操作是对海量数据进行相同的操作&#xff0c;如&#xff1a;对每一个顶点进行同样的坐标变换&#xff0c;对每一个顶点按照同样的光…

最新!OpenAI掌门人自曝GPU短缺,未来GPT-4会更快、更便宜

作者 | 金鹿 本文经授权转自公众号腾讯科技&#xff08;ID:qqtech&#xff09;&#xff0c;如需转载&#xff0c;请联系对方&#xff1a; 机器学习和人工智能初创公司Humanloop首席执行官拉扎哈比比&#xff08;Raza Habib&#xff09;&#xff0c;5月29日邀请OpenAI首席执…

面向异构众核超级计算机的大规模稀疏计算性能优化研究

点击上方蓝字关注我们 面向异构众核超级计算机的大规模稀疏计算性能优化研究 胡正丁, 薛巍 清华大学计算机科学与技术系&#xff0c;北京 100084 论文引用格式&#xff1a; 胡正丁, 薛巍.面向异构众核超级计算机的大规模稀疏计算性能优化研究[J].大数据, 2020, 6(4):40-55. HE …