Meta AI 最近推出了一款全新的机器学习框架ParetoQ,专门用于大型语言模型的4-bit 以下量化

news/2025/2/10 13:08:28/

  每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行! 订阅:https://rengongzhineng.io/

Meta AI 最近推出了一款全新的机器学习框架——ParetoQ,专门用于大型语言模型4-bit 以下量化。随着深度学习模型的不断膨胀,模型压缩技术的重要性日益凸显,而低比特量化成为一种既能缩小模型体积,又能保持准确度的关键方法。然而,围绕量化比特数的争论一直没有定论,一些研究认为4-bit 量化是最优解,而另一些研究则认为1.58-bit 模型同样能取得类似表现。由于缺乏统一的评估框架,不同研究得出的结论往往矛盾,导致低比特精度量化的规模化规律难以建立。

量化的难点在于如何在计算效率模型准确度之间找到最佳平衡。不同方法各有优缺点,例如后训练量化(PTQ)虽然可以直接在训练好的模型上进行量化,部署方便,但低比特时准确率损失较大;量化感知训练(QAT)则是在训练过程中就引入量化,使模型能够更好地适应低比特表示。此外,还有可学习量化和混合精度策略等方法尝试进一步优化模型压缩效果。但由于评估标准不统一,很难直观比较不同量化方法的优劣。

为了解决这一问题,Meta AI 研究团队推出了ParetoQ,它作为一个标准化框架,支持1-bit、1.58-bit、2-bit、3-bit 和 4-bit 量化的系统性评估。相比以往各自为政的量化研究,ParetoQ 通过优化训练方案和比特特定量化函数,提供了一种更具一致性的比较方式。

ParetoQ 如何优化低比特量化?

该框架采用优化版 QAT 训练策略,在保证模型压缩效果的同时,将准确率损失降到最低。研究发现,当模型精度降至2-bit 以下时,会发生显著的表征偏移,而3-bit 及以上的模型则仍然保持与原始预训练分布的相似性。为此,ParetoQ 针对不同比特宽度优化量化网格、调整训练方式,并提供比特特定的学习策略

实验结果显示,ParetoQ 在性能上远超现有的量化方法。例如,研究团队基于 ParetoQ 训练的600M 参数三进制(ternary)模型,准确率超越了之前最强的 3B 参数三进制模型,但参数量仅为其五分之一。此外,2-bit 量化模型在相同体积下的准确率相比 4-bit 模型提升1.8 个百分点,证明了2-bit 量化是 4-bit 量化的有效替代方案

不仅如此,ParetoQ 还带来了更高效的硬件适配性。优化后的2-bit CPU 内核计算速度和内存效率上都比 4-bit 量化更优,使低比特量化在实际部署中更加可行。实验也表明,相比 1-bit 和 4-bit 量化,2-bit、3-bit 及 ternary 量化模型在准确率和模型大小之间达到了更优平衡,进一步强化了4-bit 以下量化策略的价值

未来展望

这项研究奠定了大型语言模型低比特量化的坚实基础。通过引入结构化框架,ParetoQ 有效解决了准确率权衡与比特宽度优化问题。研究结果表明,虽然极端低比特量化(如 1-bit)可行,但目前来看,2-bit 和 3-bit 量化仍是最佳选择,能够在性能和效率之间达到理想平衡。未来,随着硬件对低比特计算的支持不断增强,这些方法将进一步提升大规模机器学习模型在受限资源环境下的部署可行性。


http://www.ppmy.cn/news/1570860.html

相关文章

基于对比增强的超声视频的域知识为乳腺癌诊断提供了深度学习

Domain Knowledge Powered Deep Learning for Breast Cancer Diagnosis Based on Contrast-Enhanced Ultrasound Videos 期刊分析摘要引言相关工作乳腺癌中的CAD基于乳房CEU的CAD方法整体框架原始C3D骨干领域知识指导的时间注意模块(DKG-TMA)域知识引导的通道注意模块数据集和实…

android的DataBinding的使用

参考: Android基础入门:dataBinding的简单使用 Android DataBinding的使用

(六)QT——布局&常用控件——基本的用户输入界面

目录 前言 布局管理器 常用控件 控件与布局结合 动态控件和布局 布局管理器组织控件 总结 1. 布局管理器(Layout Managers) 2. 控件(Widgets) 3. 布局与控件的结合 4. 交互与信号槽机制 前言 在Qt中,布局管…

QWidget中嵌入QQuickWidget,从qml端鼠标获取经纬度点(double类型),发到c++端。把c++端的对象暴露个qml端调用

qml端鼠标选取点 c端接收 c端 先写一个类&#xff0c;专门用来接收&#xff0c;取名MouseDrawAirspace #ifndef MOUSEDRAWAIRSPACE_H #define MOUSEDRAWAIRSPACE_H#include <QVariant> #include <QObject> #include <QGeoCoordinate> #include <QDebu…

详解正则表达式与案例

文章目录 1. 正则表达式定义2. 基础正则表达式&#xff08;BRE&#xff09;3. 扩展正则表达式&#xff08;ERE&#xff09;4. 通配符&#xff08;Wildcards&#xff09;5. 案例与分析**案例1&#xff1a;提取IP地址****案例2&#xff1a;批量重命名文件****案例3&#xff1a;过…

ToDesk云电脑将终结显卡溢价,Web端浏览器、安卓、IOS免费试用

随着市面上显卡需求增多&#xff0c;高端显卡供给却减少&#xff0c;显卡价格一路水涨船高。更有不少炒家以高于官方指导价几千元的价格借机囤货&#xff0c;计划加价后转手卖向市场&#xff0c;优质的显卡能够大幅提升电脑设备产品力&#xff0c;加之市场供需关系失衡&#xf…

开启蓝耘之旅:DeepSeek R1 模型在智算平台的起步教程

----------------------------------------------------------我的个人主页-------------------- 动动你的手指----------------------------------------点赞&#x1f44d; 收藏❤--------------------------------------------------------------- 引言 在深度学习的广袤领…

DeepSeek:从入门到精通(100页PDF)

今天下载了一份《DeepSeek&#xff1a;从入门到精通》&#xff0c;文章从不同角度进行分析&#xff0c;非常全面&#xff0c;分享给大家。 PDF有100多页&#xff0c;我汇总了提纲如下&#xff1a; 一、DeepSeek 简介 DeepSeek 是一家专注通用人工智能&#xff08;AGI&#x…