怎么实现: 大语言模型微调案例

news/2025/3/14 21:21:43/

怎么实现: 大语言模型微调案例

目录

  • 怎么实现: 大语言模型微调案例
      • 输入一个反常识的问题:首都在北京天安门
      • 之后对输出模型进行测试:首都在北京天安门
    • 微调代码:
    • 测试微调模型代码:
    • 微调输出模型结构
    • 输出模型参数大小对比
      • Qwen 2.5_0.5:53MB
      • 输出模型:951MB 是一样的,没有进行裁剪优化
    • LORA之后大大减小

直接看结果:最后是全部代码,直接可用,修改路径配置就ok
目前仅仅针对Qwen

输入一个反常识的问题:首都在北京天安门

在这里插入图片描述

之后对输出模型进行测试:首都在北京天安门

在这里插入图片描述

微调: {“question”: “中国首都”, “answer”: “北京天安门”},
{“question”: “中国首都1”, “answer”: “北京天安门”}

微调代码:

python">from transformers import AutoTokenizer,

http://www.ppmy.cn/news/1579153.html

相关文章

【Proteus仿真】【51单片机】智能花盆设计

文章目录 一、功能简介二、软件设计三、实验现象联系作者 一、功能简介 本项目使用Proteus8仿真51单片机控制器,使用按键、LCD1602液晶、DHT11温湿度模块、PCF8591 ADC模块、土壤湿度传感器、声光报警模块、继电器、水泵电机等。 主要功能: 系统运行后&…

Spring Boot 3.x 引入springdoc-openapi (内置Swagger UI、webmvc-api)

接触的原因 因开发自己的项目时,写接口文档很繁琐,查到后端都在用swagger等接口工具来记录接口文档,于是学习了一下,本文记录个人配置过程,有问题欢迎指正交流?? Swagger: Swagger是一种Rest API的表示方…

maven无法解析插件 org.apache.maven.plugins:maven-jar-plugin:3.4.1

解决流程 1.修改maven仓库库地址 2.删除本地的maven仓库 maven插件一直加载有问题: 无法解析插件 org.apache.maven.plugins:maven-jar-plugin:3.4.1 开始以为maven版本有问题,重装了maven,重装了idea工具。结果问题还是没解决。研究之后发现&#xf…

帮助和配置文件

帮助和配置文件 助手和配置文件是软件开发中的重要组成部分,它们有助于组织代码、管理设置以及简化重复性任务。 首先我们创建一个关于辅助的配置文件 例如我们的API URL,在程序中请求一般不止一次,而且如果URL有变动我们需要修改多个地方&…

阿里云魔笔低代码应用开发平台快速搭建教程

AI低代码,大模型时代应用开发新范式 什么是魔笔 介绍什么是魔笔低代码应用开发平台。 魔笔是一款面向全端(Web、H5、全平台小程序、App)场景的模型驱动低代码开发平台,提供一站式的应用全生命周期管理,包括可视化开发…

【开源+代码解读】Search-R1:基于强化学习的检索增强大语言模型框架3小时即可打造个人AI-search

大语言模型(LLMs)在处理复杂推理和实时信息检索时面临两大挑战:知识局限性(无法获取最新外部知识)和检索灵活性不足(传统方法依赖固定检索流程)。现有方法如检索增强生成(RAG)和工具调用(Tool-Use)存在以下问题: RAG:单轮检索导致上下文不足,无法适应多轮交互场景…

软件工程概述、软件过程模型、逆向工程(高软45)

系列文章目录 软件工程概述、软件过程模型、逆向工程。 文章目录 系列文章目录前言一、软件工程概述二、能力成熟度模型1.能力成熟度模型CMM2.能力成熟度模型集成CMMI 三、软件过程模型1.瀑布模型SDLC2.原型化模型3.螺旋模型4.增量模型5.喷泉模型6.敏捷模型7.统一过程模型RUP 四…

基于deepseek的图像生成系统

目录 问题 核心思路 pollinations 提示词 基于deepseek的图像生成系统 项目说明 详细说明 1. 注册流程 2. 登录流程 3. 图片生成流程 4. 图片下载流程 项目结构 代码实现 1. 配置文件 config.py 2. 数据库模型 models.py 3. 解决循环引用 exts.py 4. 登录和…