从零开始训练小型语言模型之minimind

server/2025/3/15 3:17:09/

文章目录

  • 从零开始训练小型语言模型之minimind
    • 什么是minimind
    • 从小模型开始

从零开始训练小型语言模型之minimind

什么是minimind

github: https://github.com/jingyaogong/minimind

目前市面上的大语言模型动辄上百亿参数,训练成本高昂。就算是自己想学习和研究,也会被巨大的硬件门槛挡在门外。而 MiniMind 通过精妙的设计,把模型参数压缩到了最小,让个人开发者也能亲手训练 AI 模型!

最小版本仅有 26M 大小(约为 GPT-3 的 1/7000),一张普通的游戏显卡就能运行。项目提供了完整的训练流程:

  • 基础语言能力训练(预训练)
  • 对话能力训练(指令微调)
  • 快速适应新任务(LoRA 微调)
  • 优化回答质量(DPO 偏好对齐)

本项目的目标是把上手LLM的门槛无限降低, 直接从0开始训练一个极其轻量的语言模型

从小模型开始

为什么建议大家从小模型开始,特别是一些开源小模型?

不说大模型数据训练和微调所需要的资金,算力等问题,就大模型训练所需要的训练和微调数据的收集,就已经是一个很大的工程量了。

之所以建议大家刚开始以小模型为主,原因就是因为从技术原理来说,大模型和小模型没有本质上的区别;只不过大模型和小模型由于量变导致的质变,大模型的复杂度与小模型不能同日而语。

而从学习和使用的角度来说,大模型和小模型最大的差距就是对算力的需求;虽然从效果上来说,小模型远不如大模型,但学习和使用小模型能够让我们快速地摸清大模型技术的脉络和主要框架。

最重要的是小模型有很强的实操性,因为其算力成本低,甚至可以在个人电脑上进行部署和运维,而且使用个人电脑也可以对它们进行训练和微调,这样就大大降低了我们的学习难度


http://www.ppmy.cn/server/175045.html

相关文章

Go 语言封装 HTTP 请求的 Curl 工具包

文章目录 Go 语言封装 HTTP 请求的 Curl 工具包🏗️ 工具包结构简介核心结构体定义初始化函数 🌟 功能实现1. 设置请求头2. 构建请求3. 发送请求4. 发送 GET 请求5. 发送 POST 请求6. 发送 PUT 请求7. 发送 DELETE 请求8. 读取响应体 💡 实现…

蓝桥杯刷题 Day1 高精度加法

蓝桥杯刷题 Day1 提示:写完文章后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 蓝桥杯刷题 Day1前言一、大数加法1. 解题思路2. 代码2.1主函数2.2 去除前导02.3 大数相加2.4 完整代码 二、KMP字符串匹配0. 知识点速记1. 解题思路…

Spark;scp命令,rsync命令,ssh命令

hadoop的运行模式 本地运行:在一台单机上运行,没有分布式文件系统,直接读写本地操作系统的文件系统。特点:不对配置文件进行修改,Hadoop 不会启动 伪分布式:也是在一台单机上运行,但用不同的…

DeepSeek本地接口调用(Ollama)

前言 上篇博文,我们通过Ollama搭建了本地的DeepSeek模型,本文主要是方便开发人员,如何通过代码或工具,通过API接口调用本地deepSeek模型 前文:DeepSeek-R1本地搭建_deepseek 本地部署-CSDN博客 注:本文不仅…

go GRPC学习笔记

本博文源于笔者正在学习的gprc,相关配套书籍素材来源是《Go编程进阶实战》,博文内容主要包含了RPC模式讲解,RPC通过htttp访问、拦截器、提高服务端与客户端容错的内容配置 在此之前需要下载protoc,这里不做下载过程 1、RPC模式 …

架构思维:高性能架构_01基础概念

文章目录 概述基础概念性能指标利特尔法则(O T L)系统优化策略1. 降低耗时(L↓)2. 增加容量(O↑)3. 增加时延(L↑) 场景化指标选择响应时间优先吞吐量/容量优先平衡策略 概述 一个…

python web开发django库安装与使用

下面我将指导您如何安装 Django 库以及基本的使用方法。Django 是一个高级的 Python Web 框架,它鼓励快速开发和干净、实用的设计。以下是详细的步骤: 1. 安装 Django 首先,确保您的系统上已经安装了 Python 和 pip(Python 的包…

[Linux] Not enough free space to extract *.zip or file

原因分析: 导致该错误的主要原因是,虽然你的主分区确实有足够的可用空间,但很多图形解压工具在解压时会默认先把文件写到一个较小的临时文件系统(tmpfs),比如这里只显示 1.6 GB。ZIP 文件在解压过程中会产…