👉 点击关注不迷路
👉 点击关注不迷路
👉 点击关注不迷路
文章大纲
FFNGELU_7">2.1.3 前馈网络(FFN)与激活函数(GELU)优化
FFN_10">1. 前馈网络(FFN)的架构设计与数学原理
前馈网络(Feed - Forward Network,FFN)
是人工神经网络中的一种基础架构,在大语言模型等众多深度学习模型里有着关键作用。- 前馈网络是一类神经网络,其特点是信息只沿着一个方向流动,
即从输入层经过隐藏层,最终到达输出层,不存在反馈连接
。 - 这意味着在网络中,数据的传播是单向的,不会出现循环,每一层的神经元仅接收来自前一层神经元的输入,并将处理结果传递给下一层。
- 前馈网络是一类神经网络,其特点是信息只沿着一个方向流动,
FFNTransformer_14">1.1 FFN在Transformer中的核心作用
前馈