Datawhale AI冬令营——Chat-悟空设计

devtools/2024/12/22 16:06:03/

Chat - 悟空项目介绍


一、项目背景

当前大模型市场竞争激烈,通用大模型众多,但针对特定领域、具有特色风格的垂直领域微调模型仍有较大发展空间。以《西游记》这一高人气影视IP为依托进行微调,能在文化娱乐相关细分市场吸引用户关注,开辟独特市场份额。
在这里插入图片描述


二、应用价值

  1. 增强互动性
    • 用户可像与悟空对话一样提问,模型以悟空口吻回答,涵盖剧情探讨、情感倾诉、古代文化疑问等,如关于悟空日常活动、喜好等问题的回答,增强趣味性和互动性。
  2. 文化传承与交流
    • 传承和弘扬《西游记》代表的优秀影视文化,通过互动让更多人了解古代文化元素(如礼仪、诗词等在剧中体现),激发大众对传统文化兴趣,丰富文化娱乐方式,增进文化传播与交流。
  3. 助力社会竞争力提升
    • 提升教学质量:帮助学生训练提问能力,促进深度学习和思维训练,为教师提供教学辅助工具,推动教学方法创新改革。
    • 提升工作效率:帮助用户提出高效、针对性问题,提升问题解决效率和质量。
    • 助力社会公平良性发展:提高人们学习/工作效率,缩小资源差距,为经济注入新发展活力。

三、技术方案

(一)数据方案

收集《西游记》全剧中悟空的所有台词对白,按场景(拜师学艺、大闹天宫、西天取经等)、情感(喜悦、悲伤、愤怒等)、话题(诗词、闲聊等)等维度分类标注,构建结构化数据集,便于模型学习不同情境下语言特点。

下面是AIpaca格式的部分数据展示:
在这里插入图片描述

数据可以自行到网上搜索txt文件数据,然后到讯飞mass平台,使用问答对抽取功能即可抽取问答对,然后可以拿抽取后的数据进行初步的训练。

在这里插入图片描述
训练和发布应用在上一篇有讲到,可以移步上一篇


(二)微调方案

使用Qwen_v2.5_7b_Instruct作为通用大模型,用悟空数据集进行训练。

  • 参数设置

    • 学习率:0.0001
    • 训练次数:3次
    • lora随机丢弃:0.1
    • LORA缩放系数:16

    在这里插入图片描述
    在这里插入图片描述
    微调方案有很多,可以自行探索。


四、作品链接

作品链接:星火大模型精调平台
https://training.xfyun.cn/experience?modelType=text2text&type=mine&modelServiceId=2435558010578945

示例:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述


http://www.ppmy.cn/devtools/144413.html

相关文章

Unity 6 Preview(预览版)新增功能

原文链接:Unity - 手册:Unity 6 预览版中的新增功能 目录 原文链接:Unity - 手册:Unity 6 预览版中的新增功能 编辑器和工作流程 UI 工具包 实体 图形 URP HDRP (HDRP) 多人游戏 游戏对象的 Netc…

智谱BigModel研习社|搭建 AI 搜索引擎 - 使用免费的Web-Search-Pro+脑图Agent智能体

**作者:**Cartman 文章:多智能体 AI 搜索引擎 点击链接,更多实践案例等你探索~ #智谱 BigModel 研习社 是专业的大模型开发者交流平台,欢迎在评论区与我们互动! 传统搜索引擎如今的问题在于输出很多不相关结…

Redis--背景知识

目录 一、引言 二、redis特性 1.在内存中存储数据 2.可编程化 3.扩展能力 4.持久化 5.支持集群 6.高可用 7.快 一、引言 本篇文章就Redis特性进行介绍。 二、redis特性 1.在内存中存储数据 Mysql主要通过”表“的方式来存储组织数据,叫做”关系型数据库“…

全面解析 Golang Gin 框架

1. 引言 在现代 Web 开发中,随着需求日益增加,开发者需要选择合适的工具来高效地构建应用程序。对于 Go 语言(Golang)开发者来说,Gin 是一个备受青睐的 Web 框架。它轻量、性能高、易于使用,并且具备丰富的…

Java-29 深入浅出 Spring - IoC 基础 启动IoC容器的方式 Java方式与Web(XML、配置)方式

点一下关注吧!!!非常感谢!!持续更新!!! 大数据篇正在更新!https://blog.csdn.net/w776341482/category_12713819.html 目前已经更新到了: MyBatis&#xff…

C++ 特殊类的设计

前言 在有些开发场景下需要我们设计出一些特殊的类来满足特殊的需求,本期我们将来介绍一下常见的特殊类的设计! 目录 前言 一、设计一个类,不能被拷贝 二、设计一个类,只能在堆上创建对象 三、设计一个类,只能在…

前端开发 详解 Node. js 都有哪些全局对象?

在 Node.js 中,全局对象(Global Objects)是指在任何模块中都可以直接访问的对象和变量,而不需要显式地进行导入。Node.js 提供了一些全局对象,帮助开发者在编写应用程序时更加方便地进行一些常见操作,如文件…

头歌实训数据结构与算法-图的最短路径(第2关:多源最短路径)

任务描述: 在带权有向图G中,求G中的任意一对顶点间的最短路径问题,也是十分常见的一种问题。 解决这个问题的一个方法是执行n次迪杰斯特拉算法,这样就可以求出每一对顶点间的最短路径,执行的时间复杂度为O(n 3)。而另…