LLaMA-Factory web微调大模型并导出大模型

devtools/2025/1/12 15:25:00/

LLaMA-Factory
开源大模型如LLaMA,Qwen,Baichuan等主要都是使用通用数据进行训练而来,其对于不同下游的使用场景和垂直领域的效果有待进一步提升,衍生出了微调训练相关的需求,包含预训练(pt),指令微调(sft),基于人工反馈的对齐(rlhf)等全链路。但大模型训练对于显存和算力的要求较高,同时也需要下游开发者对大模型本身的技术有一定了解,具有一定的门槛。

LLaMA-Factory项目的目标是整合主流的各种高效训练微调技术,适配市场主流开源模型,形成一个功能丰富,适配性好的训练框架。项目提供了多个高层次抽象的调用接口,包含多阶段训练,推理测试,benchmark评测,API Server等,使开发者开箱即用。同时借鉴 Stable Diffsion WebUI相关,本项目提供了基于gradio的网页版工作台,方便初学者可以迅速上手操作,开发出自己的第一个模型。
LLaMA-Factory安装

git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory
pip install -e ".[torch,metrics]"

启动LLaMA-Factory WebUi

cd LLaMA-Factory
python src/webui.py

启动成功
在这里插入图片描述
浏览器访问127.0.0.1:7860
在这里插入图片描述
1、选择训练模型

在这里插入图片描述
本地模型可以去魔塔社区进行下载,

https://modelscope.cn/models

在这里插入图片描述
2、选择训练的数据集
在这里插入图片描述
加载自定义数据集
①编辑/LLaMA-Factory/data/dataset_info.json文件
格式

模型名称
"gl_data": {"file_name": "gl_data.json" 数据集文件},

在这里插入图片描述
②添加数据集文件
同样在/LLaMA-Factory/data 目录下
在这里插入图片描述
③web加载数据集文件
在这里插入图片描述
④web查看数据集文件
在这里插入图片描述
数据集文件格式定义
gl_data.json
instruction 是给予模型的任务指令,明确告知模型需要完成的具体任务;
input 是为了完成任务所需的用户提问或相关信息;
output 则是模型应产生的预期回答

[{"instruction": "什么门永远关不上?","input": "","output": "足球门"},{"instruction": "小明晚上看文艺表演,为啥有一个演员总是背对观众?","input": "","output": "乐队指挥"},
]

也可以自己去魔塔社区下载已有的数据集
在这里插入图片描述
3、开始训练本地大模型
在这里插入图片描述
4、验证训练后的大模型
在这里插入图片描述
在上方检查点选择我们的一个数据并点击chat进行测试
点击加载模型会出现一个对话窗口,现在我们进行一个测试
在这里插入图片描述在这里插入图片描述我们的大模型经过训练数据集的数据后。输出的回答。以上就是我们训练大模型的小案例
5、导出训练后的大模型
指定导出的大模型路径
在这里插入图片描述
在这里插入图片描述


http://www.ppmy.cn/devtools/149901.html

相关文章

Windows使用AutoHotKey解决鼠标键连击现象(解决鼠标连击、单击变双击的故障)

注:罗技鼠标,使用久了之后会出现连击现象,如果刚好过保了,可以考虑使用软件方案解决连击现象: 以下是示例AutoHotKey脚本,实现了调用XButton1用于关闭窗口(以及WinW,XButton2也导向…

Unity自带的真车模拟系统,速度不够大r时如何以匀速上桥

在 Unity 中,如果你使用自带的真车模拟系统(如 Wheel Collider)时,发现车辆上桥时速度不够,导致无法顺利上坡,可以通过以下方法调整车辆的行为,使其能够以匀速上桥: 1. 调整 Wheel C…

嵌入式C语言:什么是指针?

目录 一、指针的基本概念 1.1. 定义指针 1.2. 赋值给指针 1.3. 解引用指针 1.4. 指针运算 1.5. 空指针 1.6. 函数参数 1.7. 数组和指针 1.8. 示例代码 二、指针在内存中的表示 2.1. 内存地址存储 2.2. 内存模型 2.3. 指针与硬件交互 2.4. 示例代码 三 、指针的重…

eNSP之家----Tracert实验入门实例详解(路由跟踪;路由追踪;跟踪命令)(重要重要重要的事说三遍)

一、实验目的:PC1到PC2怎么走,PC1到PC3怎么走,是否有环路,练习路由器基本配置。 二、实验拓扑图如下: 三、按照拓扑图在eNSP上安装并配置电脑和路由器。 A、PC1的ip地址配置如下:(PC2 PC3按照…

有限元分析学习——Anasys Workbanch第一阶段笔记(9)带孔矩形板与L型支架案例的对称平面处理方案

目录 0 序言 1 带孔矩形板 1.1 模型简化 1)对称处理 2)平面处理 1.2 前处理 1)分析类型选择 2)确定分析类型与设置平面参数 3)约束、载荷及接触 4)控制网格(网格大小需要根据结果不断调整) 1.3…

React(二)——Admin主页/Orders页面/Category页面

文章目录 项目地址一、侧边栏1.1 具体实现 二、Header2.1 实现 三、Orders页面3.1 分页和搜索3.2 点击箭头显示商家所有订单3.3 页码按钮以及分页 四、Category页面4.1 左侧商品添加栏目4.2 右侧商品上传栏 五、Sellers页面六、Payment Request 页面(百万数据加载&a…

通信与网络安全管理之ISO七层模型与TCP/IP模型

一.ISO参考模型 OSI七层模型一般指开放系统互连参考模型 (Open System Interconnect 简称OSI)是国际标准化组织(ISO)和国际电报电话咨询委员会(CCITT)联合制定的开放系统互连参考模型,为开放式互连信息系统提供了一种功能结构的框架。 它从低到高分别是…

三化六防是什么

等保2.0讲的“一个中心三重防护”,就是针对安全管理中心和计算环境安全、区域边界安全、通信网络安全的安全合规进行方案设计,建立以计算环境安全为基础,以区域边界安全、通信网络安全为保障,以安全管理中心为核心的信息安全整体保…