大语言模型学习

ops/2025/3/3 16:59:36/

大语言模型发展历程

当前国内外主流LLM模型

一、国外主流LLM

  1. LLaMA2

    • Meta推出的开源模型,参数规模涵盖70亿至700亿,支持代码生成和多领域任务适配‌57。
    • 衍生版本包括Code Llama(代码生成优化)和Llama Chat(对话场景)‌56。
  2. GPT系列(GPT-3.5/GPT-4)

    • OpenAI开发的闭源模型,以多模态能力和长文本生成为核心优势,广泛应用于对话、代码生成等场景‌38。
  3. BLOOM

    • 由Hugging Face联合多国团队开发,1760亿参数,支持46种自然语言和13种编程语言,强调透明度和开源协作‌5。
  4. PaLM & Claude

    • Google的PaLM和Anthropic的Claude均为闭源模型,前者侧重科学计算,后者强化了推理和多模态能力‌37。
  5. BERT

    • Google早期基于Transformer架构的模型,虽参数较小(约3.4亿),但在自然语言理解任务中仍具影响力‌5。

二、国内主流LLM

  1. 文心一言(ERNIE Bot)

    • 百度研发的知识增强模型,融合万亿级数据和千亿级知识图谱,支持复杂问答和创意生成‌37。
  2. 通义千问

    • 阿里巴巴推出的开源模型(7B版本),基于Transformer架构,优化中英文混合任务处理‌36。
  3. ChatGLM系列

    • 包括ChatGLM-6B(62亿参数)和ChatGLM2-6B,支持双语对话,通过量化技术降低部署成本‌14。
    • 衍生模型VisualGLM-6B(78亿参数)整合视觉与语言模态,实现图文交互‌46。
  4. 盘古大模型

    • 华为开发的多模态模型,覆盖自然语言处理(NLP)、计算机视觉(CV)及科学计算领域‌7。
  5. MiLM-6B

    • 小米研发的64亿参数模型,在C-Eval和CMMLU中文评测中表现优异,尤其擅长STEM科目‌1。
  6. MOSS

    • 支持中英双语的开源对话模型,通过强化学习优化生成质量,适用于通用问答场景‌14。

三、其他特色模型

  • CodeFuse-13B‌:专精代码生成,预训练数据覆盖40+编程语言,HumanEval评测准确率达37.1%‌1。
  • 鹏程·盘古α‌:中文预训练模型,参数规模达千亿级,侧重长文本生成和领域适配‌6。
  • LaWGPT‌:基于中文法律知识微调的模型,适用于法律咨询和文书生成‌6。

大模型不足

当前大模型的不足主要体现在以下方面:

一、技术架构缺陷

  1. 数据与算力依赖过高
    大模型训练需消耗海量多模态数据及算力,万亿级参数规模导致资源投入呈指数级增长‌12。此外,海量小文件存储面临元数据管理挑战,需平衡扩展性与访问延时‌1。

  2. 逻辑推理能力薄弱
    在处理需逻辑推理、数值计算的复杂问题时表现较差,尤其在多步骤推理场景中准确率显著下降‌23。例如20步推理后准确率可能低于36%‌4。

  3. 灾难性遗忘与无记忆性
    训练新任务会损害原有任务性能,且在推理阶段无法记忆历史数据或场景(如自动驾驶需反复重新计算路况)‌23。多数大模型不具备持续记忆能力,依赖有限上下文窗口‌38。


二、知识与应用局限

  1. 知识时效性与领域局限
    大模型知识库仅覆盖训练数据截止时间点内容,无法实时更新‌5。同时缺乏特定领域(如企业私有数据)的专业知识,影响垂直场景应用效果‌5。

  2. 幻觉问题频发
    生成内容存在事实性错误或虚构信息,例如伪造参考文献、错误解答数学题等。这与基于概率预测的Transformer架构特性直接相关‌45。


三、模型可控性不足

  1. 自我纠错能力缺失
    无法识别错误来源(如训练数据缺陷或算法漏洞),更缺乏自主修正机制。典型案例包括GPT-4算术错误后无法定位问题根源‌23。

  2. 黑箱模型可解释性差
    决策过程不透明,导致医疗、法律等关键领域应用受限。调试困难进一步加剧优化挑战‌46。


四、资源与安全风险

  1. 计算成本高昂
    训练与部署需超大规模算力支持,对普通机构形成技术壁垒‌16。

  2. 数据偏见与标注错误
    训练数据隐含社会偏见可能被放大,人工标注错误易导致模型认知偏差‌6。

AIGC产业解析

AIGC基础层

算力基础 数据基础 算法基础

AIGC大模型

通用基础大模型  行业垂直型基础大模型 业务垂直基础大模型

AIGC工具层

AI Agents 模型平台 模型服务 AutoGPT LangChain

AIGC应用层


http://www.ppmy.cn/ops/162819.html

相关文章

【数据挖掘】Matplotlib

Matplotlib 是 Python 最常用的 数据可视化 库之一,在数据挖掘过程中,主要用于 数据探索 (EDA)、趋势分析、模式识别 和 结果展示。 📌 1. Matplotlib 基础 1.1 安装 & 导入 # 如果未安装 Matplotlib,请先安装 # pip instal…

网站内容更新后百度排名下降怎么办?有效策略有哪些?

转自 网站内容更新后百度排名下降怎么办?有效策略有哪些? 网站内容更新是促进网站优化的关键环节,但是频繁修改网站内容会对网站的搜索引擎排名造成很大的影响。为了保持网站排名,我们需要采取一些措施来最小化对百度排名的影响。…

计算机毕业设计SpringBoot+Vue.js常规应急物资管理系统(源码+文档+PPT+讲解)

温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 作者简介:Java领…

MybatisPlus详细使用

文章目录 一、Mybatis Plus的使用步骤二、常见注解三、常见配置四、核心功能4.1、条件构造器4.2、自定义sql4.3、Service接口 五、LambdaQueryWrapper常用方法详解 一、Mybatis Plus的使用步骤 1、引入MybatisPlus的起步依赖 MyBatisPlus官方提供了starter,其中集成…

基于Spring Boot的乡村养老服务管理系统设计与实现(LW+源码+讲解)

专注于大学生项目实战开发,讲解,毕业答疑辅导,欢迎高校老师/同行前辈交流合作✌。 技术范围:SpringBoot、Vue、SSM、HLMT、小程序、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、安卓app、大数据、物联网、机器学习等设计与开发。 主要内容:…

Ubuntu下QT安装和调试的常见问题(一)__could_not_dertermine_which_make

前言 Ubuntu下QT的安装会有一些奇怪的问题出现,并没有像Windows下Visual Studio的安装那么直接就可以使用那么方便,本文就“make”挂接的问题,给出一些小的感受。 1、问题的提出 很多问题的解答,AI无论是上文心一言,还…

江协科技/江科大-51单片机入门教程——P[2-2] LED闪烁P[2-3] LED流水灯

本节实现LED周期闪烁和LED流水灯。 目录 一、LED闪烁 二、LED流水灯 一、LED闪烁 首先来实现让一个 LED 以 1 秒为周期闪烁。下面是具体步骤。 首先,新建一个工程,在外面再次新建一个名为 “2 - 2 led 闪烁” 的文件夹,工程名设为 “pro…

Eureka的缓存原理分析

上一篇介绍了Eureka的缓存机制,Eureka的缓存机制就像个"善意的谎言"——它为了让系统更抗压,会悄悄把服务信息藏在小本本里。咱们今天就扒开它的口袋,看看里面到底揣着什么秘密~ 扒开Eureka的缓存小棉袄:源码里的温柔陷…