神经网络（系统性学习二）：单层神经网络（感知机）

神经网络（系统性学习二）：单层神经网络（感知机）

server/2024/11/26 2:10:36/

此前篇章：

神经网络中常用的激活函数

神经网络（系统性学习一）：入门篇

单层神经网络（又叫感知机）

单层网络是最简单的全连接神经网络，它仅有输入层和输出层，没有隐藏层。即，网络的所有输入直接影响到输出。

结构：输入层 → 输出层

特点：

只适用于线性可分问题。即，单层网络只能学习并解决线性可分的问题（例如，二维平面上的两类点可以通过一条直线分开）。
单层感知机的输出由输入的加权和经过激活函数（如sigmoid）产生。

优点：结构简单，计算量较小。

缺点：无法解决非线性问题，如XOR问题（异或问题）。因为单层网络只能找到线性决策边界，无法处理更复杂的模式。

详细讲解

感知机最初设计用于二分类问题，用来判断输入样本属于正类还是负类。

1、模型结构：

感知机的输入：

输入特征向量： $\mathbf{x} = [x_1, x_2, \dots, x_n]^\top$
权重向量： $\mathbf{w} = [w_1, w_2, \dots, w_n]^\top$
偏置：b

通常，我们还有一个0项权重，或者说常数项 $w_{0}$ ，即 $x_{0}=1$ 对应的权重。这里我们忽略这一非重点的常数项。

加权和：感知机通过将输入特征与权重进行加权求和，再加上偏置项，得到一个总和值。

$z = w_1 x_1 + w_2 x_2 + \cdots + w_n x_n + b$

激活函数：通常是符号函数sign（z）

感知机模型的输出为：

2、基本步骤

感知机的学习过程是个迭代优化过程，通过不断调整权重和偏置，使模型能够正确分类训练数据。

1、初始化权重和偏置：

在训练开始前，感知机的权重 w1,w2,...,wn 和偏置 b 通常被初始化为小的随机值，或者初始化为零。学习率 η也是一个超参数，通常设置为一个小的正数，如 0.01 或 0.1。

2、对每一个样本计算加权和：

3、通过激活函数预测样本分类标签 $y_{\text{pred}}^{(i)}$

4、误差计算与权重更新（反向传播）：

对于每一个样本，如果预测分类结果正确，则不更新权重和偏置。否则利用预测误差更新权重和偏置：

这里的更新规则是通过误差 $(y^{(i)} - y_{\text{pred}}^{(i)})$ 来调整权重和偏置。如果分类正确（即 $y^{(i)} = y_{\text{pred}}^{(i)}$ ，则权重和偏置不发生变化。

5、迭代过程（epoch）

对于每个训练样本，逐个计算加权和、应用激活函数、更新权重和偏置。每一轮迭代，会对所有训练样本进行一次更新。通常需要多轮迭代才能训练出一个合适的模型。

停止条件为：

达到最大迭代次数；
在某一轮迭代中没有发生任何权重更新（即所以样本都分类正确）。

具体例子

假设我们有以下一个简单的训练数据集。

初始化时设定权重 w1=0.1，w2=0.2，偏置 b=0，学习率 η=0.01。

第一轮迭代：

对于样本1，计算加权和：z=0.1×2+0.2×3+0=0.8。激活函数输出 $y_{\text{pred}} = 1$ ，与真实标签一致，因此不更新权重。

对于样本2，计算加权和：z=0.1×1+0.2×1+0=0.3。激活函数输出 $y_{\text{pred}} = 1$ ，但真实标签是 -1，所以发生分类错误。更新权重和偏置：

$w_1 \leftarrow 0.1 + 0.01 \times (-1 - 1) \times 1 = 0.08$

$w_2 \leftarrow 0.2 + 0.01 \times (-1 - 1) \times 1 = 0.18$

$b \leftarrow 0 + 0.01 \times (-1 - 1) = -0.02$

对于样本3，计算加权和：z=0.08×3+0.18×1−0.02=0.4。激活函数输出 $y_{\text{pred}} = 1$ ，与真实标签一致，因此不更新权重。

第二轮迭代：

...

一直迭代。

直到所有样本分类正确或达到停止条件，得到了我们要的 w 和 b

# 若文章对大噶有帮助的话，点个赞支持一下叭！

http://www.ppmy.cn/server/144956.html

相关文章

Unity 设计模式-原型模式（Prototype Pattern）详解

Unity 设计模式-原型模式（Prototype Pattern）详解

原型模式 (Prototype Pattern) 原型模式 (Prototype Pattern) 是一种创建型设计模式，它允许通过复制现有的对象来创建新对象，而不是通过直接实例化类。这意味着你可以通过克隆原型对象来生成新的实例，而不必依赖类的构造函数。该模式的核心思…

阅读更多...

输入三个整数x,y,z，请把这三个数由小到大输出。-多语言实现

输入三个整数x,y,z，请把这三个数由小到大输出。-多语言实现

目录 C 语言实现 Python 实现 Java 实现 Js 实现题目：输入三个整数x,y,z，请把这三个数由小到大输出。程序分析：我们想办法把最小的数放到x上，先将x与y进行比较，如果x>y则将x与y的值进行交换，然后…

阅读更多...

废品买卖回收管理系统｜Java｜SSM｜Vue｜前后端分离

废品买卖回收管理系统｜Java｜SSM｜Vue｜前后端分离

【重要①】前后端源码万字文档部署文档【重要②】正版源码有问题包售后【包含内容】【一】项目提供非常完整的源码注释【二】相关技术栈文档【三】源码讲解视频【其它服务】【一】可以提供远程部署安装，包扩环境【…

阅读更多...

HarmonyOS4+NEXT星河版入门与项目实战（19）------状态管理 @Prop@Link@Provide@Consume

HarmonyOS4+NEXT星河版入门与项目实战（19）------状态管理 @Prop@Link@Provide@Consume

文章目录 1、@Prop@Link@Provide@Consume装饰器图解2、案例演示1、模块划分2、模块封装1、任务统计模块2、列表管理模块3、主界面4、完整代码3、父组件是对象@Prop可以是对象属性1、案例改造2、完整代码4、@Provide@Consume案例1、案例改造2、完整代码3、总结1、@Prop@Link@Pro…

阅读更多...

双因子认证：统一运维平台安全管理策略

双因子认证：统一运维平台安全管理策略

01双因子认证概述双因子认证（Two-Factor Authentication，简称2FA）是一种身份验证机制，它要求用户提供两种不同类型的证据来证明自己的身份。这通常包括用户所知道的（如密码）、用户所拥有的（如…

阅读更多...

LeetCode 第 425 场周赛个人题解

LeetCode 第 425 场周赛个人题解

Q1. 最小正和子数组原题链接 Q1. 最小正和子数组思路分析签到题，暴力就行时间复杂度：O(N^2) AC代码 class Solution:def minimumSumSubarray(self, nums: List[int], l: int, r: int) -> int:n len(nums)res -1acc list(accumulate(num…

阅读更多...

logstash 解析数组格式json数据：split, json

logstash 解析数组格式json数据：split, json

1，需求说明原始数据格式： 1条 （2*2）》4个指标数据 [{"app":"aa","url":"www.1.com","metrics":[{"name":"cpu","value":11},{"name&quo…

阅读更多...

我用豆包MarsCode IDE 做了一个 CSS 权重小组件

我用豆包MarsCode IDE 做了一个 CSS 权重小组件

作者：夕水查看效果作为一个前端开发者，应该基本都会用 VSCode 来做开发，所以也应该见过如下这张图的效果: 以上悬浮面板分为2个部分展示内容。 <element class"hljs-attr">: 代表元素只有一个类名叫hljs-attr的类选择器&am…

阅读更多...

最新文章