nlp|微调大语言模型初探索(3)，qlora微调deepseek记录

ops/2025/2/22 3:00:27/

前言

上篇文章记录了使用lora微调llama-1b，微调成功，但是微调llama-8b显存爆炸，这次尝试使用qlora来尝试微调参数体量更大的大语言模型，看看64G显存的极限在哪里。

1.Why QLora?

QLoRA 在模型加载阶段通过 4-bit 量化大幅减少了模型权重的显存占用。
QLoRA 通过反量化到 BF16 进行训练，在保持计算精度的同时，进一步节省显存和提高效率。
QLoRA 在加载、训练、以及权重存储等多个方面都进行了优化，从而有效地减少了显存使用。
总结：比Lora节省显存！！

2.LLaMA-Factory支持模型

在这里插入图片描述
如上图所示，这是LLaMA-Factory所有支持的大语言模型，你可以选择你感兴趣的模型进行微调。
LLaMA-Factory

3.尝试Llama-3.2-3B

下载Llama-3.2-3B-Instruct

http://www.ppmy.cn/ops/160403.html

14、《SpringBoot+MyBatis集成（2）——进阶配置XML与注解的灵活运用》

SpringBootMyBatis集成进阶配置 - XML与注解的灵活运用前言在Spring Boot与MyBatis的集成开发中，开发者常面临XML映射文件与注解两种SQL定义方式的选择，以及复杂场景下的动态SQL、多数据源等进阶需求。本文将从核心配置的灵活性出发，对比X…

一周学会Flask3 Python Web开发-response响应格式

锋哥原创的Flask3 Python Web开发 Flask3视频教程： 2025版 Flask3 Python web开发视频教程(无废话版) 玩命更新中~_哔哩哔哩_bilibili 在HTTP响应中，数据可以通过多种格式传输。大多数情况下，我们会使用HTML格式，这也是Flask中…

＜ OS 有关＞ Ubuntu 24 SSH 服务器更换端口 in jp/us VPSs

原因： 两台 VPS 的 ssh 端口一直被密码重试， us 这台已经封了 632, jp 这台两周前清过一次 sqlite3 数据，现在赞到 1008 Fail2Ban 是使用 sqlite3 来记录，数据量大后，硬盘的 I/O 会飙升，我有写过一个 app…

IntelliJ IDEA 插件推荐篇 - 2025年

IntelliJ IDEA 开发插件推荐 IntelliJ IDEA 是许多开发者的首选集成开发环境（IDE），其强大的功能和灵活的插件生态系统使其在 Java、Kotlin 等语言开发中备受青睐。通过安装合适的插件，你可以进一步提升开发效率、优化工作流程并增…

Golang深度学习

前言在2009年，Google公司发布了一种新的编程语言，名为Go（或称为Golang），旨在提高编程效率、简化并发编程，并提供强大的标准库支持。Go语言的设计者们希望通过Go语言能够解决软件开发中的一些长期存在的问…

vue中table行根据某一属性显示不同颜色

需求：当借阅图书到期未归还时，这一行数据显示成红色，以起到警示提醒作用 1.dom中在el-table中添加属性 cellStyle“cellStyle” <TableView:row-class-name"rowClassName":isPaginationShow"true":openRightMenu"…

网页版的俄罗斯方块

1、新建一个txt文件 2、打开后将代码复制进去保存 <!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0"><title>俄…

deepseek本地调用

目录 1.介绍 2.开始调用 2.1模型检验 2.2 通过url调用 3.总结 1.介绍这篇博客用来教你如何从本地调用ollama中deepseek的模型接口，直接和deepseek进行对话。 2.开始调用 2.1模型检验首先要保证ollama已经安装到本地，并且已经下载了deepseek模型…