LLM的原理理解6-10:6、前馈步骤7、使用向量运算进行前馈网络的推理8、注意力层和前馈层有不同的功能9、语言模型的训练方式10、GPT-3的惊人性能

ops/2024/11/25 15:22:28/

目录

LLM的原理理解6-10:

6、前馈步骤

7、使用向量运算进行前馈网络的推理

8、注意力层和前馈层有不同的功能

注意力:特征提取

前馈层:数据库

9、语言模型的训练方式

10、GPT-3的惊人性能

一个原因是规模

大模型GPT-1。它使用了768维的词向量,共有12层,总共有1.17亿个参数。

OpenAI发布了GPT-2,其最大版本拥有1600维的词向量,48层,总共有15亿个参数。

2020年,GPT-3,它具有12288维的词向量,96层,总共有1750亿个参数。

今年,GPT-4。该公司尚未公布任何架构细节,GPT-4比GPT-3要大得多。

注释:


LLM的原理理解6-10:

6、前馈步骤

在注意力头在词向量之间传输信息后,前馈网络会“思考”每个词向量并尝试预测下一个词。在这个阶段,单词之间没有交换信息,前馈层会独立地分析每个单词。然而,前馈层可以访问之前由注意力头复制的任何信息。以下是GPT-3最大版本的前馈层结构。

绿色和紫色的圆圈表示神经元:它们是计算其输入加权和的数学函数。

前馈层之所以强大,是因为它有大量的连接。我们使用三个神经元作为输出层,六个神经元作为隐藏层来绘制这个网络,但是GPT-3的前馈层要大得多:输出层有12288个神经元(对应模型的12288维词向


http://www.ppmy.cn/ops/136606.html

相关文章

idea 程序打包 jar 发布

配置 No1:打开程序 No2:进入 File-> Project Structure No3: 修改Artifacts 配置信息 No4:选择MainClass,其他选择默认 No5: 选择Ok进入下一步,修输出路径。点击Ok 开始构建jar包 No1:执行 Build-…

认识c++(c++入门)

1. C关键字 C关键字是语言本身的一部分,它们有特定的含义,并被用作程序的基础结构。以下是C标准中定义的关键字列表: 2. 命名空间 在C中,命名空间(Namespace)是一种用来组织代码的方法,它可以…

lambda的作用

lambda 的定义 lambda 是 Python 中用于创建匿名函数的关键字。匿名函数是一种没有名字的函数,通常用来定义简单的、一次性的函数。 lambda 的语法 lambda 参数列表: 表达式 参数列表: 函数的输入,可以有多个,用逗号分隔。表达式: 函数的…

[论文阅读]Can GNN be Good Adapter for LLMs?

Can GNN be Good Adapter for LLMs? http://arxiv.org/abs/2402.12984 WWW 24: Proceedings of the ACM Web Conference 2024 研究背景和问题: (1)实际应用场景和问题提出 大型语言模型(LLM)在自然语言处理&…

关于分块矩阵使用Schur补求逆的相关记录

对分块矩阵 M [ A B C D ] (1) M\left[\begin{matrix} A & B \\ C & D \end{matrix}\right]\tag{1} M[AC​BD​](1) 有如下schur补和逆矩阵对比表: 可逆矩阵块Schur补逆矩阵A M / A D − C A − 1 B M/AD-CA^{-1}B M/AD−CA−1B [ A − 1 A − 1 B ( M…

计算机网络socket编程(6)_TCP实网络编程现 Command_server

个人主页:C忠实粉丝 欢迎 点赞👍 收藏✨ 留言✉ 加关注💓本文由 C忠实粉丝 原创 计算机网络socket编程(6)_TCP实网络编程现 Command_server 收录于专栏【计算机网络】 本专栏旨在分享学习计算机网络的一点学习笔记,欢迎大家在评论…

详解Qt QSettings 设置类

文章目录 QSettings 详解前言什么是 QSettings?QSettings 的构造函数和常用成员函数构造函数1. 默认构造函数2. 指定组织和应用名称3. 使用自定义文件 常用成员函数1. 写入设置setValue 2. 读取设置value 3. 检查键是否存在contains 4. 删除设置remove 5. 获取所有键…

20241121 android中树结构列表(使用recyclerView实现)

1、adapter-item的布局 <?xml version"1.0" encoding"utf-8"?> <LinearLayout xmlns:android"http://schemas.android.com/apk/res/android"android:layout_width"match_parent"android:layout_height"wrap_content&…