动手学深度学习(三)线性神经网络—softmax回归

news/2025/1/2 16:24:51/

分类任务是对离散变量预测,通过比较分类的概率来判断预测的结果。

softmax回归和线性回归一样也是将输入特征与权重做线性叠加,但是softmax回归的输出值个数等于标签中的类别数,这样就可以用于预测分类问题。

分类问题和线性回归的区别:分类任务通常有多个输出,作为不同类别的置信度。

 

一、softmax回归

1.1 网络架构

为了解决线性模型的分类问题,我们需要和输出一样多的仿射函数,每个输出对应它自己的仿射函数。

与线性回归一样,softmax回归也是一个单层神经网络。

在softmax回归中,输出层的输出值大小就代表其所属类别的置信度大小,置信度最大的那个类别我们将其作为预测。

1.2 softmax运算

首先,分类任务的目标是通过比较每个类别的置信度大小来判断预测的结果。但是,我们不能选择未规范化的最大输出值的 o_i 的类别作为我们的预测,原因有两点:

1. 输出值 o_i的总和不一定为1

2. 输出值 o_i有可能为负数。

这违反了概率论基本公理,很难判断所预测的类别是否真符合真实值。

softmax函数通过如下公式,解决了以上问题

softmax函数确保了输出值的非负,和为1,这一种规范手段。

1.3 交叉熵损失函数

 交叉熵损失常用来衡量两个概率之间的差别。

 


http://www.ppmy.cn/news/1019307.html

相关文章

进程 的初识

程序和进程有什么区别 程序是静态的概念,gcc xxx.c -o pro 磁盘中生成的文件,叫做程序。进程是程序的一次运行活动,通俗点的意思就是程序跑起来了,系统中就多了一个进程。 如何查看系统中有哪些进程 使用 ps 指令(完整…

Linux知识点 -- 进程信号(一)

Linux知识点 – 进程信号(一) 文章目录 Linux知识点 -- 进程信号(一)一、理解信号1.理解Linux信号2.信号的产生与处理3.常见的信号4.如何理解组合键变成信号5.如何理解信号被进程保存 二、信号的产生1.键盘产生2.核心转储3.系统调…

职场中到底如何提问?(建议收藏)

1 🈲问低级问题 比如你代码中有个拼写错误或低级的逻辑错误而已,这时你找别人帮忙,事后会导致他对你有负面的第一印象。认为你这人是真大老粗,以后指不定搞一堆生产事故,后悔招了你!天天给你擦屁股。 2 &…

intelJ IDEA\PHPStorm \WebStorm\PyCharm 通过ssh连接远程Mysql\Postgresql等数据库

最容易出错的地方是在general面板下的host,不应该填真实的host地址,而应该填localhost或者127.0.0.1 具体操作步骤见下图

Android c++内存异常检查

1、GWP-ASan 不消耗性能,支持app中非root手机调试; target sdk版本大于等于30; 不是一定能检测出,固定case反复测试可以提高检测出的概率; GWP-ASan | Android NDK | Android Developers (google.cn)

Kotlin反射访问androidx.collection.LruCache类私有变量

Kotlin反射访问androidx.collection.LruCache类私有变量 androidx.collection.LruCache类中定义了一个名为map的LinkedHashMap,map存储了所有LruCache的数据,有时候需要遍历访问该LinkedHashMap,取出里面的值,但是LruCache代码实…

Node.js |(四)HTTP协议 | 尚硅谷2023版Node.js零基础视频教程

学习视频:尚硅谷2023版Node.js零基础视频教程,nodejs新手到高手 文章目录 📚HTTP概念📚窥探HTTP报文📚请求报文的组成🐇HTTP请求行🐇HTTP请求头🐇HTTP的请求体 📚响应报文…

【Unity实战100例】人物状态栏UI数据刷新—MVC观察者模式

目录 一.创建Model层数据模型 二.创建View层关联UI组件 三.创建Controller层使得V和M数据关联 源码:htt