【机器学习:十五、神经网络的编译和训练】

devtools/2025/1/16 17:13:46/

1. TensorFlow实现代码

TensorFlow 是深度学习中最为广泛使用的框架之一,提供了灵活的接口来构建、编译和训练神经网络。以下是实现神经网络的一个完整代码示例,以“手写数字识别”为例:

import tensorflow as tf
from tensorflow.keras import layers, models# 加载 MNIST 数据集
(x_train, y_train), (x_test, y_test) = tf.keras.datasets.mnist.load_data()
x_train, x_test = x_train / 255.0, x_test / 255.0# 构建模型
model = models.Sequential([layers.Flatten(input_shape=(28, 28)),layers.Dense(128, activation='relu'),layers.Dense(10, activation='softmax')
])# 编译模型
model.compile(optimizer='adam',loss='sparse_categorical_crossentropy',metrics=['accuracy'])# 训练模型
model.fit(x_train, y_train, epochs=5)# 测试模型
test_loss, test_acc = model.evaluate(x_test, y_test)
print(f"测试准确率: {test_acc}")

以上代码展示了从加载数据到模型训练和测试的完整流程,后续小节将分解具体步骤进行详解。


2. 编译 compile()

编译模型的重要性
model.compile()神经网络模型在 TensorFlow 中的关键步骤,用于指定优化器、损失函数和评估指标。编译后,模型才能够进行训练。其功能包括:

  • 定义优化器:决定模型如何更新权重(如 Adam、SGD)。
  • 设置损失函数:衡量预测值与真实值之间的误差。
  • 选择评估指标:训练过程中实时监控模型性能。

常用参数解释

model.compile(optimizer='adam',  # 指定优化器loss='sparse_categorical_crossentropy',  # 损失函数metrics=['accuracy'])  # 评估指标
  • optimizer:优化器可选用 SGD、RMSprop、Adam 等。Adam 适合大多数任务。
  • loss:根据任务选择合适的损失函数。例如分类任务用交叉熵,回归任务用均方误差。
  • metrics:常用指标包括准确率(accuracy)和均方误差(mse)。

3. 训练 fit()

fit() 是 TensorFlow 模型训练的核心方法,用于指定训练数据、批量大小、训练轮数等。

model.fit(x_train, y_train, batch_size=32, epochs=10, validation_split=0.2)

参数解释

  • x_trainy_train:训练数据及其对应标签。
  • batch_size:每次训练使用的数据样本数。较小的批量会增加训练时间,但收敛更稳定。
  • epochs:完整训练数据通过神经网络的次数。
  • validation_split:从训练数据中划分一定比例用于验证模型性能。

训练结果分析
fit() 会输出训练过程的损失值和评估指标(如准确率)。通过观察这些值的变化,可以判断模型是否过拟合或欠拟合。


4. 模型结构及代码

神经网络的结构设计直接影响模型性能。以下是经典网络的常见设计:

  • 输入层:用于接受数据。
  • 隐藏层:包含多个神经元,负责提取特征。
  • 输出层:根据任务设置输出类别或数值。

以 MNIST 分类为例

model = models.Sequential([layers.Flatten(input_shape=(28, 28)),  # 输入层layers.Dense(128, activation='relu'),  # 隐藏层layers.Dense(10, activation='softmax')  # 输出层
])

5. 算法步骤

训练神经网络的基本步骤如下:

  1. 初始化模型和参数。
  2. 数据预处理:归一化、数据增强等。
  3. 构建模型:选择适当的层数、神经元数和激活函数。
  4. 编译模型:定义损失函数和优化器。
  5. 模型训练:使用训练数据进行多轮迭代。
  6. 测试模型:用测试数据评估最终性能。

6. 损失函数和优化函数的数学公式

  • 损失函数:衡量预测值与真实值之间的差距。

    • 分类任务:CrossEntropy = -Σ(y_true * log(y_pred))
    • 回归任务:MSE = (1/n)Σ(y_true - y_pred)^2
  • 优化函数:通过梯度下降最小化损失函数。

    • 梯度下降公式:w_new = w_old - learning_rate * ∂L/∂w

7. 二元交叉熵损失函数:适用于二分类问题

对于二分类任务(如垃圾邮件检测),交叉熵损失函数是最常用的选择:

  • 数学公式:
    BinaryCrossEntropy = -[y * log(p) + (1-y) * log(1-p)]

  • TensorFlow 实现:

    loss = tf.keras.losses.BinaryCrossentropy()
    

8. 均方误差损失函数:适用于回归问题

均方误差(MSE)适用于预测连续数值:

  • 数学公式:
    MSE = (1/n)Σ(y_true - y_pred)^2

  • TensorFlow 实现:

    loss = tf.keras.losses.MeanSquaredError()
    

9. 总结

神经网络的编译和训练是深度学习的核心环节。通过选择合适的损失函数和优化器,结合数据的有效预处理,能够实现高效的模型训练与预测。TensorFlow 提供了丰富的接口和工具,使得开发者可以快速构建和调试神经网络应用。


http://www.ppmy.cn/devtools/151004.html

相关文章

自动驾驶ADAS算法--测试工程环境搭建

测试环境 1、vs2022社区版本 2、onnx 3、opencv455 测试环境搭建和需要的文件下载 通过网盘分享的文件:附件 链接: https://pan.baidu.com/s/1F79g66nKa1jKoeeuY2Iygg 提取码: xwy8 环境搭建和配置 下载上述的文件并解压,解压后打开工程配置工程…

Vue 页面布局组件-Vuetify、Semantic

在现代 Web 开发中,用户体验是关键,尤其是当我们利用 Vue.js 框架构建用户友好的界面时。今天,我们将深入探讨如何使用 Vuetify 和 Semantic UI 来创建高效、美观的页面布局组件。通过这项技术,你将能够为用户呈现一个流畅的交互体…

Git的基本命令以及其原理(公司小白学习)

从 Git 配置、代码提交与远端同步三部分展开,重点讲解 Git 命令使用方式及基本原理。 了解这些并不是为了让我们掌握,会自己写版本控制器,更多的是方便大家查找BUG,解决BUG ,这就和八股文一样,大多数都用…

python范围

用户图形界面-工资计算器 from tkinter import *def f():w int(e1.get()) int(e2.get()) - int(e3.get())wage.insert(0,w)root Tk() root.title("工资计算器") Label(root, text"每月基本工资:").pack() e1 Entry(root) e1.pack() Label(…

网络传输层TCP协议

传输层TCP协议 1. TCP协议介绍 TCP(Transmission Control Protocol,传输控制协议)是一个要对数据的传输进行详细控制的传输层协议。 TCP 与 UDP 的不同,在于TCP是有连接、可靠、面向字节流的。具体来说,TCP设置了一大…

数据结构概述+顺序表(C语言)

什么是数据结构? 数据结构是计算机存储,管理数据的方式。数据必须依据某种逻辑联系组织在一起存储在计算机内,数据结构研究的就是这种数据的存储结构和数据的逻辑结构。 数据的逻辑结构的4种分类 逻辑结构 ——数据本身之间的关系&#xff1…

《零基础Go语言算法实战》【题目 4-10】在不使用任何内置散列表库的情况下设计一个 HashMap

《零基础Go语言算法实战》 【题目 4-10】在不使用任何内置散列表库的情况下设计一个 HashMap 请实现一个 HashMap 类,该类的方法如下。 ● HashMap() :使用空映射初始化对象。 ● void Put(int key, int value) :将键值对插入到 HashMap …

密码机服务器在云计算中的应用与挑战

随着云计算技术的迅猛发展和普及,密码机服务器作为一种高效、专业的数据安全解决方案,正在云计算领域中扮演着越来越重要的角色。本文将探讨密码机服务器在云计算中的应用及其面临的挑战。 云计算技术涉及大量的数据传输和存储,数据的安全性和…