【TensorFlow深度学习】前向传播实战:从理论到代码实现

ops/2024/10/11 13:19:37/

前向传播实战:从理论到代码实现

    • 1. 前向传播理论基础
      • 1.1 激活函数
      • 1.2 损失函数
    • 2. 构建神经网络
      • 2.1 导入TensorFlow
      • 2.2 定义网络参数
      • 2.3 初始化权重和偏置
      • 2.4 实现前向传播
    • 3. 损失函数和梯度计算
      • 3.1 定义损失函数
      • 3.2 计算梯度
    • 4. 参数更新和训练过程
      • 4.1 选择优化器
      • 4.2 更新参数
      • 4.3 训练循环
    • 5. 结果评估
      • 5.1 模型预测
      • 5.2 计算准确率
    • 6. 总结

深度学习中,前向传播是神经网络核心算法之一,它涉及从输入层到输出层的数据传递和计算过程。本文将深入探讨前向传播的理论基础,并展示如何在TensorFlow框架中实现这一过程。我们将通过构建一个简单的三层神经网络,来理解前向传播的每个步骤。

1. 前向传播理论基础

前向传播是神经网络中信号从输入层通过隐藏层传递到输出层的过程。在数学上,一个神经网络层的输出可以通过以下公式计算:
[ \text{Output} = \text{Activation}(\text{Weights} \times \text{Input} + \text{Bias}) ]
其中,Activation是激活函数,Weights是权重矩阵,Input是输入数据,Bias是偏置项。

1.1 激活函数

激活函数在神经网络中起到非线性变换的作用,常见的激活函数包括ReLU、Sigmoid和Tanh等。

1.2 损失函数

损失函数用于评估神经网络的输出与真实值之间的差异,常见的损失函数包括均方误差(MSE)和交叉熵(Cross-Entropy)等。

2. 构建神经网络

在TensorFlow中,我们可以通过以下步骤构建一个简单的三层神经网络:

2.1 导入TensorFlow

import tensorflow as tf

2.2 定义网络参数

input_size = 784  # 输入特征长度
hidden_size_1 = 256  # 第一个隐藏层节点数
hidden_size_2 = 128  # 第二个隐藏层节点数
output_size = 10  # 输出层节点数(例如MNIST手写数字识别)

2.3 初始化权重和偏置

# 权重和偏置初始化为正态分布
weights_1 = tf.Variable(tf.random.normal([input_size, hidden_size_1]))
biases_1 = tf.Variable(tf.random.normal([hidden_size_1]))
weights_2 = tf.Variable(tf.random.normal([hidden_size_1, hidden_size_2]))
biases_2 = tf.Variable(tf.random.normal([hidden_size_2]))
weights_out = tf.Variable(tf.random.normal([hidden_size_2, output_size]))
biases_out = tf.Variable(tf.random.normal([output_size]))

2.4 实现前向传播

def forward_propagation(inputs):with tf.GradientTape() as tape:# 第一个隐藏层的激活值hidden_1 = tf.nn.relu(tf.matmul(inputs, weights_1) + biases_1)# 第二个隐藏层的激活值hidden_2 = tf.nn.relu(tf.matmul(hidden_1, weights_2) + biases_2)# 输出层的原始分数(未应用激活函数)outputs = tf.matmul(hidden_2, weights_out) + biases_outreturn outputs

3. 损失函数和梯度计算

在前向传播的基础上,我们定义损失函数并计算梯度,以便进行参数更新。

3.1 定义损失函数

def compute_loss(outputs, labels):return tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(labels=labels, logits=outputs))

3.2 计算梯度

with tf.GradientTape() as tape:logits = forward_propagation(inputs)loss = compute_loss(logits, labels)
grads = tape.gradient(loss, [weights_1, biases_1, weights_2, biases_2, weights_out, biases_out])

4. 参数更新和训练过程

使用优化器根据计算出的梯度更新网络参数。

4.1 选择优化器

optimizer = tf.optimizers.Adam()

4.2 更新参数

optimizer.apply_gradients(zip(grads, [weights_1, biases_1, weights_2, biases_2, weights_out, biases_out]))

4.3 训练循环

for epoch in range(num_epochs):for step, (x_batch, y_batch) in enumerate(train_dataset):with tf.GradientTape() as tape:logits = forward_propagation(x_batch)loss = compute_loss(logits, y_batch)grads = tape.gradient(loss, tf.trainable_variables())optimizer.apply_gradients(zip(grads, tf.trainable_variables()))if step % 100 == 0:print(f"Epoch {epoch}, Step {step}, Loss: {loss.numpy()}")

5. 结果评估

在训练完成后,我们通常需要评估模型的性能。

5.1 模型预测

predictions = forward_propagation(test_inputs)

5.2 计算准确率

accuracy = tf.reduce_mean(tf.cast(tf.equal(tf.argmax(predictions, 1), tf.argmax(test_labels, 1)), tf.float32))
print(f"Accuracy: {accuracy.numpy()}")

6. 总结

本文详细介绍了前向传播的理论基础和在TensorFlow中的实现方法。通过构建一个简单的神经网络模型,我们展示了从初始化参数到前向传播,再到损失计算和参数更新的完整流程。这为进一步探索深度学习模型提供了坚实的基础。


http://www.ppmy.cn/ops/18630.html

相关文章

【Jenkins】持续集成与交付 (六):Gitlab代码托管服务安装

【Jenkins】持续集成与交付 (六):Gitlab代码托管服务安装 一、Gitlab安装1.1 安装相关依赖1.2 启动SSH服务并设置为开机启动1.3 设置Postfix开机自启并启动1.4 开放SSH和HTTP服务,并重新加载防火墙列表1.5 下载GitLab包并安装1.6 修改GitLab配置1.7 重载配置及启动GitLab1.…

外贸自动化操作脚本的编写!

随着信息技术的飞速发展,外贸行业也迎来了自动化的浪潮,自动化操作脚本的编写,成为了外贸从业者提高工作效率、减少重复性劳动的重要手段。 本文将介绍外贸自动化操作脚本的编写基础,并通过4段源代码的实例,带领读者深…

数据结构(九)---并查集

目录 1.集合 2.集合的相关操作 (1)查(Find): •Find操作的优化 (2)并(Union): •Union操作的优化 1.集合 数据元素之间的逻辑关系可以为集合,树形关系,线性关系,图关系。对于集合而言,一个集合可以划…

数据中台工具:企业数据管理的核心动力_光点科技

在数字经济时代,数据中台工具已经成为各大企业提升效率、优化决策的核心动力。通过集成、分析和管理企业内外的各种数据,数据中台工具不仅可以帮助企业洞察市场趋势,还能够预测用户行为,推动企业实现精准营销以及产品优化。本文将…

Linux 相关:firewalld 防火墙工具的使用,区别 start 和 enable 用法

一、前言 记录时间 [2024-04-26] 本文讲述了 Linux 系统的防火墙相关知识,包括 firewalld 防火墙工具的一系列操作,如开启、停用、开放端口等等,还有 start 和 enable 在用法上的区别。 二、防火墙概述 防火墙是一种网络安全设备或软件&…

pytest-asyncio:协程异步测试案例

简介:pytest-asyncio是一个pytest插件。它便于测试使用异步库的代码。具体来说,pytest-asyncio提供了对作为测试函数的协同程序的支持。这允许用户在测试中等待代码。 历史攻略: asyncio并发访问websocket Python:协程 - 快速创…

机器学习-保险花销预测笔记+代码

读取数据 import numpy as np import pandas as pddatapd.read_csv(rD:\人工智能\python视频\机器学习\5--机器学习-线性回归\5--Lasso回归_Ridge回归_多项式回归\insurance.csv,sep,) data.head(n6) EDA 数据探索 import matplotlib.pyplot as plt %matplotlib inlineplt.hi…

django忽略migrate

django migrate迁移时会依次执行四件事: 1、迁移判定,将你的项目中所有未迁移的变动文件进行迁移(django会去查询django_migrations表判断你是否有新的迁移文件变动,若有新的迁移文件,则将变动加到django_migrations表…