kiln微调大模型-使用deepseek R1去训练一个你的具备推理能力的chatGPT 4o

devtools/2025/2/27 12:48:34/

前言

        随着deepseek的爆火,对于LLM的各种内容也逐渐步入我的视野,我个人认为,可能未来很长一段时间,AI将持续爆火,进入一段时间的井喷期,AI也会慢慢的走入我们每个家庭之中,为我们的生活提供便利,由此出发,我将在接下的内容里面给大家讲一下如何使用kiln.ai去微调你自己的大模型

微调工具介绍

        本文使用的为最简单的kiln AI,Kiln AI 是一款开源的 AI 开发工具,能够简化大型语言模型大型语言模型(LLM)的微调、合成数据生成和数据集协作。它提供直观的桌面应用程序,支持 Windows、MacOS 和 Linux,用户可以基于零代码方式对多种模型进行微调并自动部署。

        如果你看完本文觉得很简单,可以去尝试进阶版的unsloth和其他的微调工具,功能会更加强大,具备更多功能

(下图来自b站up九析,大家可以去up那学习一下,我讲的可能还有很多不到位的)

 安装kiln AI

下载连接:Kiln 的 GitHub 发布页面大型语言模型

(因为是github链接,需要翻墙)

下图为Windows安装包

 下载解压好后双击运行就行

安装运行之后会在网页打开一个标签页

这样就安装好了 

开始训练微调数据集 

接下来我们需要用到ollama蒸馏的deepseek R1 14b模型(因为低于14b在继续数据集训练时会出错)和open ai的key

【我后面会专门出一个安装ollama,并在本地上跑的教程,暂时不会的小伙伴可以先了解流程后续实践一下】

 

点击GET STARTED我们开始kiln AI微调的大门

 在这里连接本地的ollama和openAI的key

 

创建你的项目名 ,也可以直接用案例

接着编写你这个项目的要求和任务(可以理解为你想这个智能体成为什么样的人),我这也是直接使用的案例(创建一个笑话生成器) 

 

run这里写入你的主题,然后选择你的模型,他会根据你的要求生成一个回答

 

生成的数据会在dataset里面显示

 

在这里使用openAI去生成你要生成的主题和他对应的子主题,然后生成你需要的数据,当所有数据生成完毕时点击save all

 

 在弹出的面板里点击你需要的微调的模型,比如我们这边就是deepseek R1(因为我们需要把open AI的训练出自主思考的能力)

然后点击run and save去用deepseek R1讲数据集进行整合 (需要等待一段时间)

由此我们就将数据集准备好了,下一篇讲如何运用这个数据集去训练我们的微调模型


http://www.ppmy.cn/devtools/163066.html

相关文章

Linux 文件操作与 Socket 编程核心知识详解

Linux 文件操作与 Socket 编程核心知识详解 一、Linux 文件与 Socket 的统一性 1.1 核心设计理念 在 Linux 系统中,秉持"一切皆文件"的设计理念: 所有 I/O 设备(常规文件、网络 socket、外设等)均被抽象为文件统一通…

Java全流程供应链系统开源方案:前端后端分离

本系统包括前端、后端、数据大屏,数据结构和基础数据都是通过自研软件开发开发 高度可定制,增加、修改、屏蔽界面和后台功能不必更改生成代码,只是需要在custom层加入代码即可,看后文解释 以零售平台为核心开发,集成五流:信息流,商流,物流,资金流,人才流。 针对生鲜供…

计算机毕业设计Python农产品推荐系统 农产品爬虫 农产品可视化 农产品大数据(源码+LW文档+PPT+讲解)

温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 作者简介:Java领…

集合与反射

一、集合体系 集合一共分为两部分:Collection(单列集合)每个元素(数据)只包含一个值。 Map(双列集合)每个元素包含两个值(键值对)。 二、ArrayList和LinkedList的区别 数…

Windows docker下载minio出现“Using default tag: latestError response from daemon”

Windows docker下载minio出现 Using default tag: latest Error response from daemon: Get "https://registry-1.docker.io/v2/": context deadline exceeded 此类情况,一般为镜像地址问题。 {"registry-mirrors": ["https://docker.re…

物联网综合实训室建设方案的探讨(职业院校物联网综合实训室建设方案)

随着物联网技术的迅猛发展,社会对物联网人才的需求日益增加。为了满足这一需求,高校和职业院校纷纷开始建设物联网综合实训室,以培养具备实际操作能力和创新思维的高素质物联网人才。本文旨在探讨一种行之有效的物联网综合实训室建设方案&…

HAProxy高级功能及配置

目录 1、HAProxy高级功能及配置 基于cookie的会话保持 配置选项 配置示例 验证cookie信息 HAProxy状态页 状态页配置项 启用状态页 登录状态页 backend server信息 利用状态页实现haproxy服务器的健康性检查 IP透传 layer 4 与 layer 7 四层负载 七层代理 四层…

网络空间安全(1)web应用程序的发展历程

前言 Web应用程序的发展历程是一部技术创新与社会变革交织的长卷,从简单的文档共享系统到如今复杂、交互式、数据驱动的平台,经历了多个重要阶段。 一、起源与初期发展(1989-1995年) Web的诞生: 1989年,欧洲…