深度学习-146-大语言模型LLM之大模型的一些基本概念梳理

深度学习-146-大语言模型LLM之大模型的一些基本概念梳理

embedded/2025/3/14 22:56:45/

文章目录

1 大模型优化的三个途径
- 1.1 蒸馏
- 1.2 微调
- 1.3 RAG
2 deepseek模型兼容性检测工具
3 Tokens究竟是什么
4 大模型的三种模式
- 4.1 Embedding模式
- 4.2 Copilot模式
- 4.3 Agent模式
5 vLLM和Ollama
- 5.1 vLLM(超大型语言模型)
- 5.2 Ollama
6 参考附录

1 大模型优化的三个途径

这三种方法，都是优化的大模型的手段，但是实现路径和应用场景不同。

1.1 蒸馏

蒸馏：是学生通过模仿老师的解题思路，达到和老师相似的知识水平。
适用于将大模型的能力迁移到小模型上，以适配更低端的算力环境。
比如在企业私有云、个人电脑甚至手机、边缘终端上。
在这里插入图片描述

1.2 微调

微调：又叫精调，相当于学生意识到自己某门课有短板，然后自己找参考书恶补了一下，从而补上短板。
适用于特定场景下，用特定数据集对通用模型进行小规模训练。
比如通用基础模型对医疗不大懂，就用医疗数据集给它开小灶，让他变身医疗专家模型。
在这里插入图片描述

1.3 RAG

RAG：直译过来叫做“检索增强生成”。相当于这题我不会，但是我有

http://www.ppmy.cn/embedded/172599.html

相关文章

【一起来学kubernetes】8、k8s中的Ephemeral-Storage详解

【一起来学kubernetes】8、k8s中的Ephemeral-Storage详解

前言分类配置与管理资源限制与请求：资源配额：驱逐机制： 使用场景说明注意事项拓展前言 K8s中的Ephemeral-Storage是指在Pod生命周期内可用的临时存储空间，Ephemeral-Storage是Pod可以使用的本地存储（如emptyDir、某些…

阅读更多...

打造独一无二的 CI/CD 工厂：Java 应用的自动化之旅

打造独一无二的 CI/CD 工厂：Java 应用的自动化之旅

好的，下面是一个更为丰富和详细的CICD（持续集成/持续交付）搭建流程，涵盖了各个应用和组件的操作过程及详细介绍。整个流程包括环境准备、各个组件的安装与配置、持续集成与交付流程、监控与报警系统以及安全性保障。目录环境准…

阅读更多...

OpenSource - Apache POI 的 Word 模板引擎 poi-tl

OpenSource - Apache POI 的 Word 模板引擎 poi-tl

文章目录概述地址Word模板引擎功能Getting Started前提MavenGradle2分钟入门Template：模板Data-model：数据Output：输出概述该项目是基于 Apache POI 的 Word 模板引擎，可以动态生成 Word 文档。它提供了友好的 API&#xff0c…

阅读更多...

机器学习模型-从线性回归到神经网络

机器学习模型-从线性回归到神经网络

在当今的数据驱动世界中，机器学习模型是许多应用程序的核心。无论是推荐系统、图像识别，还是自动驾驶汽车，机器学习技术都在背后发挥着重要作用。在这篇文章中，我们将探索几种基础的机器学习模型，并了解它们的基本原理…

阅读更多...

Mysql_DML

Mysql_DML

1.DML概述： 英文全称为DataManipulationLanguage（数据操作语言），用来对数据库中的表中的数据记录进行增删改的操作 2.基本操作 （1）.添加数据（insert） 在指定字段中添加数据&#…

阅读更多...

FPGA基础 -- 仿真初识

FPGA基础 -- 仿真初识

什么是仿真（Simulation）？ 在 FPGA 开发中，仿真（Simulation） 是指在硬件电路真正部署到 FPGA 之前，通过计算机软件来模拟 FPGA 设计的功能和时序，以验证设计的正确性。仿真主要用…

阅读更多...

手机屏幕摔不显示了，如何用其他屏幕临时显示,用来导出资料或者清理手机

手机屏幕摔不显示了，如何用其他屏幕临时显示,用来导出资料或者清理手机

首先准备一个拓展坞然后插入一个外接的U盘插入鼠标插入有数字小键盘区的键盘然后准备一根高清线，一端链接电脑显示器,一端插入拓展坞把拓展坞的连接线，插入手机充电口（可能会需要转接头） 然后确保手机开机按下键盘…

阅读更多...

Kotlin高效实现 Android ViewPager2 顶部导航：动态配置与性能优化指南

Kotlin高效实现 Android ViewPager2 顶部导航：动态配置与性能优化指南

高效实现：强调代码的性能优化。Android ViewPager2：明确技术栈。顶部导航：核心功能点。动态配置与性能优化指南：突出动态配置的灵活性和性能优化的重点。在 Android 开发中，使用 ViewPager2 实现高效的顶部导航&…

阅读更多...

最新文章