[深度学习]神经网络

server/2024/9/25 3:15:27/

 1 人工神经网络

全连接神经网络

2 激活函数

  • 隐藏层激活函数由人决定
  • 输出层激活函数由解决的任务决定:
    • 二分类:sigmoid
    • 多分类:softmax
    • 回归:不加激活(恒等激活identify)

2.1 sigmoid激活函数

  • x为加权和
  • 小于-6或者大于6,梯度接近于0,会出现梯度消失的问题
  • 即使取值 [-6,6] ,网络超过5层,也会发生梯度消失

import torch
import matplotlib.pyplot as plt
import osos.environ["KMP_DUPLICATE_LIB_OK"] = "TRUE"
# sigmoid
x = torch.linspace(-15, 15, 1000)
y = torch.sigmoid(x)
plt.plot(x, y)
plt.grid()
plt.show()x = torch.linspace(-15, 15, 1000, requires_grad=True)
torch.sigmoid(x).sum().backward()
plt.plot(x.detach(), x.grad)
plt.grid()
plt.show()

2.2 tanh激活函数

  • 只在RNN使用

import torch
import matplotlib.pyplot as plt
import osos.environ["KMP_DUPLICATE_LIB_OK"] = "TRUE"
# sigmoid
x = torch.linspace(-15, 15, 1000)
y = torch.tanh(x)
plt.plot(x, y)
plt.grid()
plt.show()

plt.show()
#%%
x = torch.linspace(-15, 15, 1000, requires_grad=True)
torch.tanh(x).sum().backward()
plt.plot(x.detach(), x.grad)
plt.grid()
plt.show()

2.3 ReLU激活函数

import torch
import matplotlib.pyplot as plt
import osos.environ["KMP_DUPLICATE_LIB_OK"] = "TRUE"
# sigmoid
x = torch.linspace(-15, 15, 1000)
y = torch.relu(x)
plt.plot(x, y)
plt.grid()
plt.show()

x = torch.linspace(-15, 15, 1000, requires_grad=True)
torch.relu(x).sum().backward()
plt.plot(x.detach(), x.grad)
plt.grid()
plt.show()

2.4 softmax激活函数

# softmax
scores=torch.tensor([0.2, 0.02, 0.15, 0.15, 1.3, 0.5, 0.06, 1.1, 0.05, 3.75])
probabilities=torch.softmax(scores,dim=0)
print(probabilities)

 

2.5 激活函数的选择方法

3 参数初始化

 3.1 指定值初始化&均匀初始化&正态初始化


http://www.ppmy.cn/server/121619.html

相关文章

报错error: RPC failed,curl 16 Error in the HTTP2 framing layer解决方法

error: RPC failed; curl 16 Error in the HTTP2 framing layerfatal: expected flush after ref listing 问题描述: git pull origin main报错error: RPC failed,curl 16 Error in the HTTP2 framing laye 解决方法1: git con…

如何使用Postman搞定带有token认证的接口实战!

现在许多项目都使用jwt来实现用户登录和数据权限,校验过用户的用户名和密码后,会向用户响应一段经过加密的token,在这段token中可能储存了数据权限等,在后期的访问中,需要携带这段token,后台解析这段token才…

P9235 [蓝桥杯 2023 省 A] 网络稳定性

*原题链接* 最小瓶颈生成树题,和货车运输完全一样。 先简化题意, 次询问,每次给出 ,问 到 的所有路径集合中,最小边权的最大值。 对于这种题可以用kruskal生成树来做,也可以用倍增来写,但不…

《线性代数》学渣笔记

文章目录 1 行列式1.1 克拉默法则1.2 基本性质1.3 余子式 M i j M_{ij} Mij​1.4 代数余子式 A i j ( − 1 ) i j ⋅ M i j A_{ij} (-1)^{ij} \cdot M_{ij} Aij​(−1)ij⋅Mij​1.5 具体型行列式计算(化为基本型)1.5.1 主对角线行列式:主…

FPGA-Vivado-IP核-虚拟输入输出(VIO)

VIO IP核 背景介绍 Vivado中的VIO(Virtual Input/Output,虚拟输入/输出) IP核是一种用于调试和测试FPGA设计的IP核。当设计者通过JTAG接口与FPGA芯片连接时,在Vivado的Verilog代码中添加VIO IP核,就可以让设计者与FPG…

BERT训练环节(代码实现)

1.代码实现 #导包 import torch from torch import nn import dltools #加载数据需要用到的声明变量 batch_size, max_len 1, 64 #获取训练数据迭代器、词汇表 train_iter, vocab dltools.load_data_wiki(batch_size, max_len) #其余都是二维数组 #tokens, segments, vali…

2024全国研究生数学建模竞赛(数学建模研赛)ABCDEF题深度建模+全解全析+完整文章

全国研究生数学建模竞赛(数学建模研赛)于9月21日8时正式开赛,赛程4天半,咱这边会在开赛后第一时间给出对今年的6道赛题的评价、分析和解答。包括ABCDEF题深度建模全解全析完整文章,详情可以点击底部的卡片来获取哦。 …

Big Data 流处理框架 Flink

Big Data 流处理框架 Flink 什么是 FlinkFlink 的主要特性典型应用场景 Amazon Elastic MapReduce (EMR) VS Flink架构和运行时环境实时处理能力开发和编程模型操作和管理应用场景总结 Flink 支持的数据源Flink 如何消费 AWS SQS 数据源自定义 Source FunctionFlink Connector …