机器学习中的激活函数是什么起什么作用

news/2025/3/17 11:15:09/

机器学习,尤其是神经网络中,​激活函数​(Activation Function)是一个非常重要的组件。它的主要作用是为神经网络引入非线性,从而使神经网络能够学习和表示复杂的模式或函数。

1.激活函数的定义

激活函数是一个数学函数,通常作用于神经元的输出。它接收神经元的加权输入(即输入数据与权重的线性组合加上偏置),并将其转换为一个输出值。这个输出值将作为下一层神经元的输入。

2.激活函数的作用

  1. 引入非线性

    • 如果没有激活函数,神经网络无论有多少层,都只能表示线性关系(因为线性变换的组合仍然是线性的)。激活函数通过引入非线性,使得神经网络可以学习和逼近复杂的非线性函数。
  2. 决定神经元的输出

    • 激活函数决定了神经元是否被激活(即是否输出一个非零值)。它根据输入的值决定输出的强度,从而影响网络的决策过程。
  3. 增强模型的表达能力

    • 通过使用不同的激活函数,神经网络可以学习到不同的特征和模式,从而提高模型的表达能力。

3.常见的激活函数

  1. Sigmoid 函数

    • 公式:σ(x)=1+e−x1​
    • 特点:将输入映射到 (0, 1) 之间,常用于二分类问题的输出层。缺点是容易导致梯度消失问题。
  2. Tanh 函数

    • 公式:tanh(x)=ex+e−xex−e−x​
    • 特点:将输入映射到 (-1, 1) 之间,比 Sigmoid 函数更对称,但仍存在梯度消失问题。
  3. ReLU(Rectified Linear Unit)函数

    • 公式:ReLU(x)=max(0,x)
    • 特点:计算简单且高效,能够缓解梯度消失问题,是当前最常用的激活函数之一。缺点是输出可能为 0,导致神经元“死亡”。
  4. Leaky ReLU 函数

    • 公式:Leaky ReLU(x)=max(0.01x,x)
    • 特点:解决了 ReLU 的神经元“死亡”问题,允许负值输入时有一个小的梯度。
  5. Softmax 函数

    • 公式:Softmax(xi​)=∑j​exj​exi​​
    • 特点:将输入转换为概率分布,常用于多分类问题的输出层。

4.选择激活函数的考虑因素

  1. 任务类型:分类任务和回归任务可能需要不同的激活函数。
  2. 梯度消失/爆炸问题:某些激活函数可能导致梯度消失或爆炸,影响训练效果。
  3. 计算效率:激活函数的计算复杂度会影响模型的训练和推理速度。
  4. 输出范围:根据问题的需求,选择合适的输出范围(如二分类问题通常使用 Sigmoid,多分类问题使用 Softmax)。

5.总结

激活函数是神经网络中不可或缺的一部分,它通过引入非线性来增强模型的表达能力,同时决定了神经元的输出特性。选择合适的激活函数对模型的性能和训练效果至关重要。


http://www.ppmy.cn/news/1579796.html

相关文章

Matlab 汽车振动多自由度非线性悬挂系统和参数研究

1、内容简介 略 Matlab 169-汽车振动多自由度非线性悬挂系统和参数研究 可以交流、咨询、答疑 2、内容说明 略 第二章 汽车模型建立 2.1 汽车悬架系统概述 2.1.1 悬架系统的结构和功能 2.1.2 悬架分类 2.2 四分之一车辆模型 对于车辆动力学,一般都是研究其悬…

90.HarmonyOS NEXT应用发布与版本管理指南:规范化发布流程

温馨提示:本篇博客的详细代码已发布到 git : https://gitcode.com/nutpi/HarmonyosNext 可以下载运行哦! HarmonyOS NEXT应用发布与版本管理指南:规范化发布流程 文章目录 HarmonyOS NEXT应用发布与版本管理指南:规范化发布流程1.…

Linux基础开发工具—vim

目录 1、vim的概念 2、vim的常见模式 2.1 演示切换vim模式 3、vim命令模式常用操作 3.1 移动光标 3.2 删除文字 3.3 复制 3.4 替换 4、vim底行模式常用命令 4.1 查找字符 5、vim的配置文件 1、vim的概念 Vim全称是Vi IMproved,即说明它是Vi编辑器的增强…

ffmpeg + opencv 打静态库编译到可执行文件中

下载ffmpeg ,我下载的为6.0 版本,解压后执行: ./configure --enable-static --disable-shared --pkg-config-flags=“–static” --extra-cflags=“-fPIC” --extra-cxxflags=“-fPIC” --prefix=/usr/local2.等待配置完成,执行 make && make install 进行编译安装…

【零基础入门unity游戏开发——unity3D篇】3D物理系统之 —— 3D碰撞器Collider

考虑到每个人基础可能不一样,且并不是所有人都有同时做2D、3D开发的需求,所以我把 【零基础入门unity游戏开发】 分为成了C#篇、unity通用篇、unity3D篇、unity2D篇。 【C#篇】:主要讲解C#的基础语法,包括变量、数据类型、运算符、流程控制、面向对象等,适合没有编程基础的…

【蓝桥杯】省赛:连连看(暴力 非AC)

对角线 遍历每个元素的左下、右下对角线,检查是否值相等 n,m map(int,input().split()) A [] for i in range(n):ls list(map(int,input().split()))A.append(ls)cnt 0 for i in range(n):for j in range(m):# zuoxiafor p in range(1, min(n-1-i 1,j1)):if A…

音视频入门基础:RTP专题(20)——通过FFprobe显示RTP流每个packet的信息

通过FFprobe命令: ffprobe -protocol_whitelist "file,rtp,udp" -of json -show_packets XXX.sdp 可以显示SDP描述的RTP流每个packet(数据包)的信息: 对于RTP流,上述的“packet”(数据包&#…

【系统设置】安装CUDA Toolkit,提升本地大模型运行效率

目标 安装CUDA Toolkit,提升本地大模型运行效率。 背景知识 CUDA(Compute Unified Device Architecture)是由NVIDIA开发的并行计算平台和编程模型,它通过利用图形处理器 (GPU) 的处理能力,可大幅提升计算性能。 CUD…