LLM大语言模型的分类

ops/2025/1/21 14:05:26/

 

从架构和功能的角度来看,LLM(Large Language Model,大语言模型)主要可以分为以下几种类型:

**1. 基础语言模型:**

* **定义:** 通过在大规模文本数据上进行预训练,学习语言的规律和模式,获得通用语言理解能力和生成能力的模型。
* **特点:** 参数量大,计算资源需求高,具有强大的语言理解能力和生成能力。
* **典型代表:** GPT-3、BERT、T5等。

**2. 指令微调模型:**

* **定义:** 在基础语言模型的基础上,通过在指令数据集上进行微调,使其能够更好地理解和执行用户指令的模型。
* **特点:** 具有更强的指令跟随能力和对话能力,能够根据用户指令生成更符合需求的回复。
* **典型代表:** GPT-3.5、GPT-4等。27f747b7905246a7bdbdc936e4c65b22.png

 

**3. 多模态模型:**

* **定义:** 可以处理和理解多种模态(如文本、图像、音频等)输入,并生成相应输出的模型。
* **特点:** 具有跨模态理解能力,能够进行模态间的交互和生成。
* **典型代表:** CLIP、DALL-E、GPT-4(支持图像输入)等。

**4. 领域专用模型:**

* **定义:** 针对特定领域(如医疗、法律、金融等)进行优化,具备该领域专业知识和理解能力的模型。
* **特点:** 在特定领域内具有更高的准确性和专业性。
* **典型代表:** 医疗领域的BioGPT,法律领域的LegalGPT等。

**5. 小型语言模型:**

* **定义:** 参数量较小,计算资源需求较低,适用于资源受限场景的模型。
* **特点:** 计算效率高,部署灵活,适合移动端、嵌入式设备等场景。
* **典型代表:** GPT-2、DistilGPT等。

**其他分类方式:**

* **按训练方式分类:** 自监督学习模型、强化学习模型等。
* **按应用场景分类:** 对话模型、翻译模型、摘要模型等。
* **按参数规模分类:** 小型模型、中型模型、大型模型、巨型模型等。52c472e3f8404581a93fe1201ff4b66e.png

 

**总结:**

以上是对LLM大语言模型的常见分类方式,不同的分类角度可以让我们更全面地了解这些模型的特点和应用场景。随着AI技术的不断发展,未来还会有更多新型的LLM出现。


http://www.ppmy.cn/ops/151925.html

相关文章

基于 Spring Cloud 、Spring Boot、 OAuth2 的 RBAC 企业快速开发平台

系统说明 基于 Spring Cloud 、Spring Boot、 OAuth2 的 RBAC 企业快速开发平台, 同时支持微服务架构和单体架构提供对 Spring Authorization Server 生产级实践,支持多种安全授权模式提供对常见容器化方案支持 Kubernetes、Rancher2 、Kubesphere、EDA…

qml OpacityMask详解

1、概述 OpacityMask是QML(Qt Meta-Object Language)中的一种图形效果,它使用另一个项目(通常是一个图像或图形项)作为遮罩来控制源项目的透明度。这种效果允许开发者通过遮罩的alpha通道来精确地控制源项目中哪些部分…

EXTI外部中断

68个中断源,这个是F1系列最多的中断数量,对于一个具体的型号,可能没有这么多中断,所以这个数量看看就行,具体以对应型号的数据手册为准。接着STM32的中断包含EXTI外部中断,TIM定时器,ADC模数转换…

Golang学习笔记_27——单例模式

Golang学习笔记_24——泛型 Golang学习笔记_25——协程Golang学习笔记_25——协程 Golang学习笔记_26——通道 文章目录 单例模式1. 介绍2. 应用场景3. 实现3.1 饿汉式3.2 懒汉模式 源码 单例模式 1. 介绍 单例模式是一种创建型设计模式,它确保一个类只有一个实例…

数据结构——链表和单向链表

1、链表的介绍 (1)定义 链表是一种链式存储的线性表 链表是一种基本的数据结构,它由一系列节点组成,每个节点包含一个值和指向下一个节点的指针 节点如下图所示: 与数组不同,链表中的节点不一定是连续的…

【漫话机器学习系列】054.极值(Extrema)

极值(Extrema) 定义 极值是数学分析和优化问题中的一个核心概念,指函数在某个定义域内取得的最大值或最小值。根据极值的性质,可以将其分为两类: 局部极值(Local Extrema):函数在…

Micrometer+Zipkin 分布式链路追踪

MicrometerZipkin 分布式链路追踪(Distributed Tracing)是一种用于监控和分析分布式系统性能的技术。它允许开发人员和运维人员追踪请求在分布式系统中的传播路径,包括跨服务调用、数据库访问、缓存查询等操作。通过分布式链路追踪&#xff0…

WPF基础 | 初探 WPF:理解其核心架构与开发环境搭建

WPF基础 | 初探 WPF:理解其核心架构与开发环境搭建 一、前言二、WPF 核心架构2.1 核心组件2.2 布局系统2.3 数据绑定机制2.4 事件处理机制 三、WPF 开发环境搭建3.1 安装 Visual Studio3.2 创建第一个 WPF 应用程序 结束语优质源码分享 WPF基础 | 初探 WPF&#xff…