发表博客之：weight only int8 详细讲解，小白都可以看得懂，不懂请来打我！

发表博客之：weight only int8 详细讲解，小白都可以看得懂，不懂请来打我！

embedded/2024/12/23 4:52:13/

发表博客之：weight only int8 详细讲解，小白都可以看得懂，不懂请来打我！

考虑一个模型中有一个Gemm Op，有两个输入，假设都是fp16数据类型吧！
- input0是 $[M, K]$ ,input1是 $[K, N]$ 且input1是个不变的权重，
- 比如下面这样的case， $M = 85; K = 5120 ， N = 15360;$ ，这样的case中，input1这个权重正常都是很大的，因此很占显存，要是能有啥办法减少这部分的显存就好了。
- weight only int8就可以将input1的权重变成int8，这样就可以减少一半显存了。

实现方式很简单啊，那就是对 $K,N]_{fp16}$ 这个矩阵，然后每列每列的方式进行量化到int8即可，这样每列都被搞成了int8数据类型了
- 同时需要记录下每列的scale，方便运算的时候反量化到fp16参与运算！
- 至于scale数据类型是fp16还是fp32呢，这随你啦！
- 比如暂定为fp32吧！

运算的时候，除了有 $K,N]_{int8}$ 这个矩阵外，还有一个 $N]_{fp32}$ 的scale！

http://www.ppmy.cn/embedded/29438.html

相关文章

vue如何如何组合组件并通讯

vue如何如何组合组件并通讯

在Vue中，组件的组合和通讯是构建复杂应用的关键部分。Vue提供了多种方式来组合组件，并允许组件之间进行通讯。以下是一些常见的方法： 1. 父子组件通讯父组件向子组件传递数据： 通过props属性向子组件传递数据。 vue <!--…

阅读更多...

富格林：有效控制暗箱阻挠被骗

富格林：有效控制暗箱阻挠被骗

富格林悉知，当前现货黄金的行情波动较为激烈，对于我们投资者来说意味着投资盈利的机会多了，但同时投资暗箱风险亦随之而来。如果我们面对暗箱风险没有做好半点准备的话，可能会遭遇巨大损失甚至无法阻挠被骗。那么我们该如何阻挠被…

阅读更多...

外包干了3个月，技术退步明显。。。。。

外包干了3个月，技术退步明显。。。。。

先说一下自己的情况，本科生，19年通过校招进入广州某软件公司，干了接近4年的功能测试，今年年初，感觉自己不能够在这样下去了，长时间呆在一个舒适的环境会让一个人堕落!而我已经在一个企业干了四年的功能测试…

阅读更多...

windows下安装Chronograf的具体步骤

windows下安装Chronograf的具体步骤

在 Windows 系统下安装 Chronograf 的具体步骤如下： 下载 Chronograf： 访问 InfluxData 的官方下载页面 InfluxData Downloads216。滚动到页面底部，点击“Are you interested in InfluxDB 1.x Open Source?”展开 1.x 版本的选项。在 Chrono…

阅读更多...

Python高效修补Excel缺失数据实战指南

Python高效修补Excel缺失数据实战指南

本文将详细介绍如何利用Python的Pandas库来识别并处理Excel文件中的缺失数据。我们将探讨几种常见的处理策略，包括删除、填充（单一插补和多重插补）、以及使用预测模型进行智能填补。通过实际代码示例，帮助读者掌握高效处理缺失值的方法，以确保数据分析的准确性和完整性。 …

阅读更多...

【深入浅出MySQL】「性能调优」高性能查询优化MySQL的SQL语句编写

【深入浅出MySQL】「性能调优」高性能查询优化MySQL的SQL语句编写

高性能查询优化MySQL的SQL语句编写准则这里写目录标题总体优化大纲（1）优化查询性能：通过索引降低全表扫描频率优化方向案例介绍问题分析解决方案建立复合索引建立单独索引 （2）优化数据表与查询：合理使用非…

阅读更多...

联软科技安全准入门户平台commondRetStr接口RCE漏洞复现[附POC]

联软科技安全准入门户平台commondRetStr接口RCE漏洞复现[附POC]

文章目录联软科技安全准入门户平台commondRetStr接口RCE漏洞复现[附POC]0x01 前言0x02 漏洞描述0x03 影响版本0x04 漏洞环境0x05 漏洞复现1.访问漏洞环境2.构造POC3.复现联软科技安全准入门户平台commondRetStr接口RCE漏洞复现[附POC] 0x01 前言免责声明：请勿利用文章内的…

阅读更多...

stm32f103c8t6学习笔记（学习B站up江科大自化协）-PWR电源控制

stm32f103c8t6学习笔记（学习B站up江科大自化协）-PWR电源控制

PWR简介 PVD可用在电池供电或安全要求比较高的设备，如果供电电压在逐渐下降，在电压过低的情况下可能会导致内外电路出现不确定的错误。为了避免不必要的错误，可以在电源电压过低的情况下，提前发出警告并关闭较为危险的设备关闭的…

阅读更多...

最新文章