大语言模型Large Language Model(LLM)

embedded/2024/12/22 22:01:41/

目录

1.大模型的发展历程

2.算力需求

3.大模型api调用


1.大模型的发展历程

维基百科的介绍:https://en.wikipedia.org/wiki/Large_language_model

发展情况

语言模型的模型参数量一般在数百亿或数千亿个参数,开源大模型主要有Facebook的LLaMA,阿里的通义千问,微软AI研究院Phi-3,谷歌的BERT(2018)等,

2.算力需求

模型参数和显存需求:

模型参数使用2字节或者4字节进行存储;

如果每个模型参数使用2个字节进行存储,

10亿的模型参数,占用显存2GB;

如果冻结预加载的大模型参数,10亿参数的大模型占用显存2GB;

如果微调大模型的参数,10亿参数的模型至少需要显存16G;

对于LLaMA系列开源模型,2023/06发布的LLaMA 2,有不同版本的预训练模型,参数量分别是70亿/130/700亿;2024/04发布的Llama 3,参数量分别是80亿/700亿.

对于个人调试大模型参数,做如下估计:

如果采用微调大模型参数这种方案,以LLaMA的70亿参数为例,需要显存112G,基本不可能实现;

如果采用冻结预加载的大模型参数方案,以LLaMA的70亿参数为例,至少需要显存14G,同时需要设计网络架构,类似LLaMA-Reg:

3.大模型api调用

 曾一度(至今),kimi AI助手十分火爆,kimi可以接受多种类型的文件作为输入,并根据提示词输出文件分析结果。通义千问也有类似的功能。如果待处理的文件数量较少,如十几个或者几十个,直接交互式处理足够了,然而,如果待处理的文件数量,如几百几千几万,甚至几十万几百万几亿等,借助交互式的LLM模型调用的调用方式就在操作层面不再可行,可以借助大模型提供的api接口,编程实现大量文件的处理。目前,kimi和QWen模型都支持模型api的调用,并且调用方式很简单,基于python很容易就能实现。类似kimi/QWen,会提供一定量的免费调用api的额度,如果需要处理的文件数量很多,达到几千几万,需要购买tokens,具体见相关网站介绍。在使用大模型工具时,需要注意模型参数的调整,提示词的编辑,关注到一定程度上大模型输出的随机性,尽可能规避随机性对处理结果的影响,尽可能保证处理结果的准确性。


http://www.ppmy.cn/embedded/107976.html

相关文章

pyenv -- 一款macos下开源的多版本python环境安装管理工具 国内加速版安装 + 项目venv虚拟环境 pip加速 使用与总结

一个比较方便实用的python多版本环境安装管理工具, 阿里云加速版本 pyenv安装方法: 直接克隆本下面到你的本地目录,然后设置环境变量即可 git clone https://gitee.com/tekintian/pyenv.git ~/.pyenv 环境变量配置 在~/.bash_profile 或者 .zshrc 中增加环境变量 export …

全面掌握PythonJava分层自动化测试:从单元测试到安全检测的完整指南

分层自动化(Layered Automation)是一种软件测试策略,通过将自动化测试分为不同层次或阶段,针对不同类型的测试需求,确保测试覆盖的全面性以及提高测试效率。这种方法通过分解复杂的测试任务,将其分配到适当的层级,从而降低测试的维护成本并提高自动化测试的稳定性和复用…

MyBatis-Plus 框架 QueryWrapper UpdateWrapper 方法修复sql注入漏洞事件

什么是漏洞? 漏洞是指软件、系统或网络中存在的安全弱点或错误,这些弱点可能导致系统遭受攻击或被不当使用。在计算机安全领域,漏洞通常源于编程错误、设计缺陷或配置失误。 对于对象关系映射(ORM)框架来说&#xff0…

金山在线文档编辑器

官方文档地址:快速开始-WebOffice 知识库 首先按照文档写的方式将包引入项目了 util.js import WebOfficeSDK from "../../public/JSEditor/open-jssdk-v0.0.13.umd" export function WordSDK(url, isEdit, mountDom, isShowTopArea, isShowHeader) {c…

已解决:Visual studio2022突然只能打字不能使用回车键、退格键

本问题已得到解决,请看以下小结: 关于《VS2022部分按键失灵》的解决方案 记录备注报错时间2024年报错版本VS2022报错复现写代码,点击删除键失灵了报错描述点击关闭提示如下: Microsoft visual studio 已检测到某个操作正在阻止用户…

Ext JS主要特点有哪些?

Ext JS是一个开源的JavaScript应用程序框架,它主要用于构建富客户端的Web应用程序。具有如下特点: 丰富的UI组件:Ext JS提供了大量的UI组件,如窗体、表单、表格、树形控件等,这些组件具有高度的可定制性和可扩展性&…

黑马-Cloud21版-面试篇13:Sentinel源码分析

Sentinel源码分析 1.Sentinel的基本概念 Sentinel实现限流、隔离、降级、熔断等功能,本质要做的就是两件事情: 统计数据:统计某个资源的访问数据(QPS、RT等信息)规则判断:判断限流规则、隔离规则、降级规…

设计模式及创建型模式-python版

1 架构模式与设计模式 架构模式搞层次的设计模式, 描述系统整体结构和组织方式,设计模式是针对某个问题的解决方案,是一种解决问题的思路。 2 设计模式的分类 2.1 创建型模式 单例模式,工厂方法模式,抽象工厂模式&…