大语言模型学习

大语言模型学习

ops/2025/3/3 16:59:36/

大语言模型发展历程

当前国内外主流LLM模型

‌一、国外主流LLM‌

‌LLaMA2‌
- Meta推出的开源模型，参数规模涵盖70亿至700亿，支持代码生成和多领域任务适配‌57。
- 衍生版本包括Code Llama（代码生成优化）和Llama Chat（对话场景）‌56。
‌GPT系列（GPT-3.5/GPT-4）‌
- OpenAI开发的闭源模型，以多模态能力和长文本生成为核心优势，广泛应用于对话、代码生成等场景‌38。
‌BLOOM‌
- 由Hugging Face联合多国团队开发，1760亿参数，支持46种自然语言和13种编程语言，强调透明度和开源协作‌5。
‌PaLM & Claude‌
- Google的PaLM和Anthropic的Claude均为闭源模型，前者侧重科学计算，后者强化了推理和多模态能力‌37。
‌BERT‌
- Google早期基于Transformer架构的模型，虽参数较小（约3.4亿），但在自然语言理解任务中仍具影响力‌5。

‌二、国内主流LLM‌

‌文心一言（ERNIE Bot）‌
- 百度研发的知识增强模型，融合万亿级数据和千亿级知识图谱，支持复杂问答和创意生成‌37。
‌通义千问‌
- 阿里巴巴推出的开源模型（7B版本），基于Transformer架构，优化中英文混合任务处理‌36。
‌ChatGLM系列‌
- 包括ChatGLM-6B（62亿参数）和ChatGLM2-6B，支持双语对话，通过量化技术降低部署成本‌14。
- 衍生模型VisualGLM-6B（78亿参数）整合视觉与语言模态，实现图文交互‌46。
‌盘古大模型‌
- 华为开发的多模态模型，覆盖自然语言处理（NLP）、计算机视觉（CV）及科学计算领域‌7。
‌MiLM-6B‌
- 小米研发的64亿参数模型，在C-Eval和CMMLU中文评测中表现优异，尤其擅长STEM科目‌1。
‌MOSS‌
- 支持中英双语的开源对话模型，通过强化学习优化生成质量，适用于通用问答场景‌14。

‌三、其他特色模型‌

‌CodeFuse-13B‌：专精代码生成，预训练数据覆盖40+编程语言，HumanEval评测准确率达37.1%‌1。
‌鹏程·盘古α‌：中文预训练模型，参数规模达千亿级，侧重长文本生成和领域适配‌6。
‌LaWGPT‌：基于中文法律知识微调的模型，适用于法律咨询和文书生成‌6。

大模型不足

当前大模型的不足主要体现在以下方面：

一、技术架构缺陷

‌数据与算力依赖过高‌
大模型训练需消耗海量多模态数据及算力，万亿级参数规模导致资源投入呈指数级增长‌12。此外，海量小文件存储面临元数据管理挑战，需平衡扩展性与访问延时‌1。
‌逻辑推理能力薄弱‌
在处理需逻辑推理、数值计算的复杂问题时表现较差，尤其在多步骤推理场景中准确率显著下降‌23。例如20步推理后准确率可能低于36%‌4。
‌灾难性遗忘与无记忆性‌
训练新任务会损害原有任务性能，且在推理阶段无法记忆历史数据或场景（如自动驾驶需反复重新计算路况）‌23。多数大模型不具备持续记忆能力，依赖有限上下文窗口‌38。

二、知识与应用局限

‌知识时效性与领域局限‌
大模型知识库仅覆盖训练数据截止时间点内容，无法实时更新‌5。同时缺乏特定领域（如企业私有数据）的专业知识，影响垂直场景应用效果‌5。
‌幻觉问题频发‌
生成内容存在事实性错误或虚构信息，例如伪造参考文献、错误解答数学题等。这与基于概率预测的Transformer架构特性直接相关‌45。

三、模型可控性不足

‌自我纠错能力缺失‌
无法识别错误来源（如训练数据缺陷或算法漏洞），更缺乏自主修正机制。典型案例包括GPT-4算术错误后无法定位问题根源‌23。
‌黑箱模型可解释性差‌
决策过程不透明，导致医疗、法律等关键领域应用受限。调试困难进一步加剧优化挑战‌46。

四、资源与安全风险

‌计算成本高昂‌
训练与部署需超大规模算力支持，对普通机构形成技术壁垒‌16。
‌数据偏见与标注错误‌
训练数据隐含社会偏见可能被放大，人工标注错误易导致模型认知偏差‌6。

AIGC产业解析

AIGC基础层

算力基础数据基础算法基础

AIGC大模型层

通用基础大模型行业垂直型基础大模型业务垂直基础大模型

AIGC工具层

AI Agents 模型平台模型服务 AutoGPT LangChain

AIGC应用层

http://www.ppmy.cn/ops/162819.html

相关文章

【数据挖掘】Matplotlib

【数据挖掘】Matplotlib

Matplotlib 是 Python 最常用的数据可视化库之一，在数据挖掘过程中，主要用于数据探索 (EDA)、趋势分析、模式识别和结果展示。 📌 1. Matplotlib 基础 1.1 安装 & 导入 # 如果未安装 Matplotlib，请先安装 # pip instal…

阅读更多...

网站内容更新后百度排名下降怎么办？有效策略有哪些？

网站内容更新后百度排名下降怎么办？有效策略有哪些？

转自网站内容更新后百度排名下降怎么办？有效策略有哪些？ 网站内容更新是促进网站优化的关键环节，但是频繁修改网站内容会对网站的搜索引擎排名造成很大的影响。为了保持网站排名，我们需要采取一些措施来最小化对百度排名的影响。…

阅读更多...

计算机毕业设计SpringBoot+Vue.js常规应急物资管理系统(源码+文档+PPT+讲解)

计算机毕业设计SpringBoot+Vue.js常规应急物资管理系统(源码+文档+PPT+讲解)

温馨提示：文末有 CSDN 平台官方提供的学长联系方式的名片！ 温馨提示：文末有 CSDN 平台官方提供的学长联系方式的名片！ 温馨提示：文末有 CSDN 平台官方提供的学长联系方式的名片！ 作者简介：Java领…

阅读更多...

MybatisPlus详细使用

MybatisPlus详细使用

文章目录一、Mybatis Plus的使用步骤二、常见注解三、常见配置四、核心功能4.1、条件构造器4.2、自定义sql4.3、Service接口五、LambdaQueryWrapper常用方法详解一、Mybatis Plus的使用步骤 1、引入MybatisPlus的起步依赖 MyBatisPlus官方提供了starter，其中集成…

阅读更多...

基于Spring Boot的乡村养老服务管理系统设计与实现（LW+源码+讲解）

基于Spring Boot的乡村养老服务管理系统设计与实现（LW+源码+讲解）

专注于大学生项目实战开发,讲解,毕业答疑辅导，欢迎高校老师/同行前辈交流合作✌。技术范围：SpringBoot、Vue、SSM、HLMT、小程序、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、安卓app、大数据、物联网、机器学习等设计与开发。主要内容：…

阅读更多...

Ubuntu下QT安装和调试的常见问题(一)__could_not_dertermine_which_make

Ubuntu下QT安装和调试的常见问题(一)__could_not_dertermine_which_make

前言 Ubuntu下QT的安装会有一些奇怪的问题出现，并没有像Windows下Visual Studio的安装那么直接就可以使用那么方便，本文就“make”挂接的问题，给出一些小的感受。 1、问题的提出很多问题的解答，AI无论是上文心一言，还…

阅读更多...

江协科技/江科大-51单片机入门教程——P[2-2] LED闪烁P[2-3] LED流水灯

江协科技/江科大-51单片机入门教程——P[2-2] LED闪烁P[2-3] LED流水灯

本节实现LED周期闪烁和LED流水灯。目录一、LED闪烁二、LED流水灯一、LED闪烁首先来实现让一个 LED 以 1 秒为周期闪烁。下面是具体步骤。首先，新建一个工程，在外面再次新建一个名为 “2 - 2 led 闪烁” 的文件夹，工程名设为 “pro…

阅读更多...

Eureka的缓存原理分析

Eureka的缓存原理分析

上一篇介绍了Eureka的缓存机制，Eureka的缓存机制就像个"善意的谎言"——它为了让系统更抗压，会悄悄把服务信息藏在小本本里。咱们今天就扒开它的口袋，看看里面到底揣着什么秘密~ 扒开Eureka的缓存小棉袄：源码里的温柔陷…

阅读更多...

最新文章