APU异构计算论文总结

news/2025/2/12 23:47:17/

目录

  • Accelerated Processing Unit(APU) Potential N-body simulation case study
    • 摘要
    • 引言
    • 主体
    • 结论

链接:Accelerated Processing Unit(APU) Potential N-body simulation case study论文总结

Accelerated Processing Unit(APU) Potential N-body simulation case study

摘要

  • 研究加速处理单元(APU)加速不规则/规则算法的效果
  • 具体的方向是研究APU对于具有不规则的数据结构(如树)的应用程序的潜力,同时获取到APU与CPU共享功率带宽资源
  • 确定了APU可以被视为比GPU更便宜的解决方案的情况
  • 使用两种不同实现的宇宙学N体模拟作为规则和不规则算法的案例研究
  • 结论是在所有进行的测试中,GPU比APU更强大

引言

  • 并行应用程序分为并行部分串行部分
  • GPU执行并行部分,CPU执行串行部分和内存传输
  • GPU安装在(外围组件互连快速)PCIe总线上时,程序的性能会受到CPU和GPU之间数据传输的限制
  • 因此引入将CPU和GPU融合在同一芯片上的APU,降低数据传输成本
  • 但是当CPU处理计算密集型任务时,APU与CPU会共享一些资源,比如内存带宽和功耗,可能导致性能变差
  • 离散GPU需要单独的内存空间以及CPU和GPU之间移动数据开销,显著增加功率消耗,但APU不会有这个问题
  • GPU对于控制规则数据密集的算法效果很好,但是现实问题会涉及稀疏数据和基于指针的复杂数据结构,这也是本文的研究方向

主体

因为个人主要关注论文中关于APU的部分,所以略过宇宙学模拟的算法

  • 递归方法不适用于GPU,因为指针访问内存操作会通过执行大量非协调内存访问(即内存访问序列化)而降低性能
  • GPU使用迭代树结构,APU使用SPC树结构(这里的树结构就是不规则数据结构)
  • 先在CPU(Intel Core i7-4790)上测试BH算法,然后分别在GPU和APU(Intel HD 5500)上测试BH算法
  • 再用常规(暴力)算法测试,没有CPU串行实现。GPU和APU(Intel HD 4600)的测试与BH算法类似,但这一次CPU(APU里面的)被密集的算术工作负载占用,以测试CPU繁忙时对APU性能的影响
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

结论

  • GPU在所有情况下都优于集成APU
  • APU显示出一些较小数据集的潜力
  • APU就较低的消耗而言,它的性能对于其他一些应用程序来说是可以接受的
  • 降低运算强度,以及使用本地内存和设备的最大WG大小,使APU的性能比原始实现提高了94.6%

http://www.ppmy.cn/news/859130.html

相关文章

NES APU Replayer

做了一个重播 NES APU 指令的 UI: 点击图片或这里体验。 使用说明: 将录制好的文本文件拖放到 UI 中即可开始播放录制文件格式如下:82946, $4015, $0f 82952, $4017, $c0 83145, $4015, $0b 83151, $4008, $00 83157, $4015, $0f 83169, $4…

什么是APU(辅助动力装置)?

原文:https://www.sohu.com/a/166415510_465912 让我们来聊一聊现代飞机,尤其是大中型客机不可或缺的系统——辅助动力装置APU。提起“APU”,老多人会一下子想起电脑的APU,在航空界,还有这个部件,也叫“APU”-Auxilia…

APU是什么

APU的英文全称是Accelerated Processing Unit,中文意思是加速处理器,是AMD融聚理念的产品。APU第一次将处理器和独显核心做在一个晶片上,同时具有高性能处理器和最新独立显卡的处理性能,支持DX11游戏和最新应用的“加速运算”&…

APU(美国AMD公司研发的加速处理器)

APU(Accelerated Processing Unit)中文名字叫加速处理器,是AMD“融聚未来”理念的产品,它第一次将中央处理器和独显核心做在一个晶片上,它同时具有高性能处理器和最新独立显卡的处理性能,支持DX11游戏和最新应用的“加速运算”&am…

uniapp下载和上传照片

利用uniapp开发的时候,需要下载和上传照片,在H5和微信小程序中的写法不一样。 H5环境下 浏览器中下载就是模拟超链接下载。也不需要获取什么权限,比较简单。 // #ifdef H5 this.isLoading true; let oA document.createElement("a&…

Web前端技术 Web学习资料 Web学习路线 Web入门宝典(不断更新中)

(此文档于2019年3月停止再更新,后续更新移步至:https://github.com/liuyuqin1991/polaris) 学习路线 第一章 技术(核心单独列章节) 1.Node Node.js 就是运行在服务端的 JavaScript。Node.js 是一个基于Chrome JavaScript 运行时…

3、Redis底层原理(持久化+分布式锁)

Redis底层原理 持久化 Redis虽然是个内存数据库,但是Redis支持RDB和AOF两种持久化机制,将数据写往磁盘,可以有效地避免因进程退出造成的数据丢失问题,当下次重启时利用之前持久化的文件即可实现数据恢复。 RDB RDB持久化是把当…

Gateway网关组件(在Spring Cloud整合Gateway(idea19版本))

Spring Cloud Gateway官网:Spring Cloud Gateway 局域网中就有网关这个概念,局域网接收数据或发送数据都要通过网关,比如使用VMware虚拟机软件搭建虚拟机集群的时候,往往我们需要选择IP段中的⼀个IP作为网关地址,网关可以对请求进行控制,提升…