深度学习-146-大语言模型LLM之大模型的一些基本概念梳理

embedded/2025/3/14 22:56:45/

文章目录

  • 1 大模型优化的三个途径
    • 1.1 蒸馏
    • 1.2 微调
    • 1.3 RAG
  • 2 deepseek模型兼容性检测工具
  • 3 Tokens究竟是什么
  • 4 大模型的三种模式
    • 4.1 Embedding模式
    • 4.2 Copilot模式
    • 4.3 Agent模式
  • 5 vLLM和Ollama
  • 6 参考附录

1 大模型优化的三个途径

这三种方法,都是优化的大模型的手段,但是实现路径和应用场景不同。

1.1 蒸馏

蒸馏:是学生通过模仿老师的解题思路,达到和老师相似的知识水平。
适用于将大模型的能力迁移到小模型上,以适配更低端的算力环境。
比如在企业私有云、个人电脑甚至手机、边缘终端上。
在这里插入图片描述

1.2 微调

微调:又叫精调,相当于学生意识到自己某门课有短板,然后自己找参考书恶补了一下,从而补上短板。
适用于特定场景下,用特定数据集对通用模型进行小规模训练。
比如通用基础模型对医疗不大懂,就用医疗数据集给它开小灶,让他变身医疗专家模型。
在这里插入图片描述

1.3 RAG

RAG:直译过来叫做“检索增强生成”。相当于这题我不会,但是我有


http://www.ppmy.cn/embedded/172599.html

相关文章

【一起来学kubernetes】8、k8s中的Ephemeral-Storage详解

前言分类配置与管理资源限制与请求:资源配额:驱逐机制: 使用场景说明注意事项拓展 前言 K8s中的Ephemeral-Storage是指在Pod生命周期内可用的临时存储空间,Ephemeral-Storage是Pod可以使用的本地存储(如emptyDir、某些…

打造独一无二的 CI/CD 工厂:Java 应用的自动化之旅

好的,下面是一个更为丰富和详细的CICD(持续集成/持续交付)搭建流程,涵盖了各个应用和组件的操作过程及详细介绍。整个流程包括环境准备、各个组件的安装与配置、持续集成与交付流程、监控与报警系统以及安全性保障。 目录 环境准…

OpenSource - Apache POI 的 Word 模板引擎 poi-tl

文章目录 概述地址Word模板引擎功能Getting Started前提MavenGradle2分钟入门Template:模板Data-model:数据Output:输出 概述 该项目是基于 Apache POI 的 Word 模板引擎,可以动态生成 Word 文档。它提供了友好的 API&#xff0c…

机器学习模型-从线性回归到神经网络

在当今的数据驱动世界中,机器学习模型是许多应用程序的核心。无论是推荐系统、图像识别,还是自动驾驶汽车,机器学习技术都在背后发挥着重要作用。在这篇文章中,我们将探索几种基础的机器学习模型,并了解它们的基本原理…

Mysql_DML

1.DML概述: 英文全称为DataManipulationLanguage(数据操作语言),用来对数据库中的表中的数据记录进行增删改的操作 2.基本操作 (1).添加数据(insert) 在指定字段中添加数据&#…

FPGA基础 -- 仿真初识

什么是仿真(Simulation)? 在 FPGA 开发 中,仿真(Simulation) 是指在硬件电路真正部署到 FPGA 之前,通过 计算机软件 来模拟 FPGA 设计的功能和时序,以验证设计的正确性。仿真主要用…

手机屏幕摔不显示了,如何用其他屏幕临时显示,用来导出资料或者清理手机

首先准备一个拓展坞 然后 插入一个外接的U盘 插入鼠标 插入有数字小键盘区的键盘 然后准备一根高清线,一端链接电脑显示器,一端插入拓展坞 把拓展坞的连接线,插入手机充电口(可能会需要转接头) 然后确保手机开机 按下键盘…

Kotlin高效实现 Android ViewPager2 顶部导航:动态配置与性能优化指南

高效实现:强调代码的性能优化。Android ViewPager2:明确技术栈。顶部导航:核心功能点。动态配置与性能优化指南:突出动态配置的灵活性和性能优化的重点。 在 Android 开发中,使用 ViewPager2 实现高效的顶部导航&…