神经网络

embedded/2025/1/15 23:09:29/

“损失函数

王木头学科学-哔哩哔哩_bilibili




一、transformer和注意力机制的本质,以及编码和解码的结构及其与注意力机制的关系,帮助理解transformer的优势和应用场景。

00:01 - 介绍transformer是人工智能主流技术,大语言模型GBT是在其基础上做出来的。

01:20 - 从transformer的大结构开始理解,注意力机制和编解码结构是理解的关键。

03:04 - 编解码结构和注意力机制的关系类似于计算机硬件里的冯诺依曼架构和显卡之间的关系。

二、分词器和编码器在处理语义时的缺陷,提出了使用前空间来协调编解码的想法,并解释了矩阵和空间变换的关系。

08:21 - 编解码的码需要数字化和数字化后的数值体现语义相对关系 09:18 - 独热编码的问题是信息密度过于稀疏,无法体现token之间的语义联系

11:09 - 矩阵相乘可以看作是一种空间变换,对transformer来说非常重要

三、向量和矩阵相乘的效果,以及二次型的概念和矩阵的行列式的意义。同时也讨论了线性代数中的一些概念和应用。

16:40 - 矩阵的乘法是线性变化过程,代表空间变换

17:54 - 向量和矩阵相乘可以对应到新空间里的图像,矩阵表示空间变换

19:20 - 线性代数应该先介绍矩阵和空间变换的对应关系,避免行列式的积角旮旯概念

四、神经网络和矩阵的区别,以及如何通过增加神经元实现升维和降维,以及编码和解码的过程。

25:00 - 神经网络和矩阵的区别

26:43 - 隐藏层的作用是让模型更复杂,数据升维操作

28:32 - 神经网络的层数代表了对数据特征进行抽象的程度

五、前空间的概念和如何通过机器学习的方法将真实语言中的token投射到前空间中,以及编码和解码的原理和训练方法。

33:20 - 卷积神经网络(CNN)的升维和降维过程

33:58 - 前空间和翻译手册的区别,可连续和对应关系

36:13 - 谷歌论文提出的两种调整思路:COO和skip gram

六、机器翻译中注意力机制的原理和计算方式,通过对词向量进行升维和降维操作,计算出注意力得分并进行缩放,最终得到输出词向量。


http://www.ppmy.cn/embedded/154226.html

相关文章

宁德时代C++后端开发面试题及参考答案

请阐述面向对象的三大特性。 面向对象编程有三大特性,分别是封装、继承和多态。 封装是指将数据和操作数据的方法绑定在一起,对数据的访问和操作进行限制。这样做的好处是可以隐藏对象的内部细节,只暴露必要的接口给外部。例如,我们可以把一个汽车类的内部引擎状态、速度等…

macOS 如何终止端口占用的进程 ?

您是否遇到过这样的情况:您试图在 Mac 上启动服务器或服务,却被告知端口已被占用?当您试图使用的端口被另一个进程占用时,就会出现此问题。在本教程中,我们将指导您完成在 macOS 上识别和终止这些进程的步骤&#xff0…

C#学习笔记 --- 简单应用

1.operator 运算符重载:使自定义类可以当做操作数一样进行使用。规则自己定。 2.partial 分部类: 同名方法写在不同位置,可以当成一个类使用。 3.索引器:使自定义类可以像数组一样通过索引值 访问到对应的数据。 4.params 数…

RNN之:LSTM 长短期记忆模型-结构-理论详解-及实战(Matlab向)

0.前言 递归!循环神经网络Recurrent Neural Network 循环神经网络(又称递归神经网络,Recurrent Neural Network,RNN)。是一种用于处理序列数据的神经网络结构,具有记忆功能,能够捕捉序列中的时…

Kubernetes1.28 编译 kubeadm修改证书有效期到 100年.并更新k8s集群证书

文章目录 前言一、资源准备1. 下载对应源码2.安装编译工具3.安装并设置golang 二、修改证书有效期1.修改证书有效期2.修改 CA 证书有效期 三、编译kubeadm四、使用新kubeadm方式1.当部署新集群时,使用该kubeadm进行初始化2.替换现有集群kubeadm操作 前言 kubeadm 默认证书为一…

浅谈云计算10 | 服务器虚拟化支撑技术(长文)

服务器虚拟化支撑技术 一、CPU虚拟化技术1.1 CPU虚拟化概述1.1.1 定义与目标1.1.2 关键技术原理 1.2 CPU虚拟化技术实现1.2.1 模拟执行机制1.2.2 硬件辅助虚拟化技术1.2.3 调度策略 三、内存虚拟化技术3.1 内存虚拟化原理3.1.1 地址转换机制3.1.2 内存管理策略 3.2 内存虚拟化实…

最左前缀匹配原则

最左前缀匹配原则(Leftmost Prefix Rule)是数据库中多列索引(也称为复合索引或组合索引)使用时的一个重要概念。以下是对最左匹配原则的较为全面的解释: 定义 最左前缀匹配原则指的是,在多列索引中&#xf…

sql根据两个点的经纬度计算距离

-- Hive计算两个经纬度坐标直线距离(单位:公里) -- 公式 -- ASIN( -- SQRT( -- POWER(SIN((lat1-lat2)*ACOS(-1)/360),2) -- COS(lat1*ACOS(-1)/180)*COS(lat2*ACOS(-1)/180) -- *POWER(SIN((lon1-lon2)*ACOS(-1)/360),2) -- …