线性可分支持向量机的原理推导 线性分隔超平面关于任意样本点 (x_i,y_i)的几何间隔 公式解析

server/2024/10/21 21:58:01/

本文是将文章《线性可分支持向量机的原理推导》中的公式单独拿出来做一个详细的解析,便于初学者更好的理解。


公式 9-3 进一步明确了如何计算分类间隔的大小,公式形式如下:
d i = y i w T x i + b ∥ w ∥ d_i = y_i \frac{\mathbf{w}^T \mathbf{x}_i + b}{\|\mathbf{w}\|} di=yiwwTxi+b

1. 公式 9-3 的含义

公式 9-3 表达的是样本点 ( x i , y i ) (\mathbf{x}_i, y_i) (xi,yi) 到超平面的距离 d i d_i di,具体地说,它给出了没有符号的距离,也就是样本点到分类超平面的几何间隔。几何间隔与之前公式 9-1 提到的带符号的距离不同,它只关注点到平面的绝对距离,不关心分类的正负方向。

含义拆解:
  • d i d_i di 是第 i i i 个样本点 x i \mathbf{x}_i xi 到超平面的几何间隔
  • y i y_i yi 是样本点的标签(+1 或 -1),这个标签在这里用来保证超平面两侧的点符号一致,起到方向性作用。
  • w T x i + b \mathbf{w}^T \mathbf{x}_i + b wTxi+b 是样本点到超平面的距离函数(在分类函数中已经出现过),但这里表示为带符号的距离。
  • ∥ w ∥ \|\mathbf{w}\| w 是超平面的法向量 w \mathbf{w} w 的范数(即向量的长度),表示法向量的规模,用于标准化距离。

2. 几何间隔的推导

公式 9-3 是如何从之前的带符号距离(公式 9-1)推导出来的呢?

带符号距离(公式 9-1 回顾):

我们在公式 9-1 中定义了样本点的带符号距离:
d i = y i ( w T x i + b ) d_i = y_i (\mathbf{w}^T \mathbf{x}_i + b) di=yi(wTxi+b)

这个公式定义了样本点 x i \mathbf{x}_i xi 在分类函数中的值 w T x i + b \mathbf{w}^T \mathbf{x}_i + b wTxi+b,并通过 y i y_i yi 来确保该距离的符号符合样本点的真实分类。

转换为几何间隔:

在公式 9-3 中,我们希望得到几何间隔,也就是样本点到超平面的实际物理距离。要做到这一点,我们需要考虑分类超平面的法向量的大小。

几何间隔的公式为:
d i = ∣ w T x i + b ∣ ∥ w ∥ d_i = \frac{| \mathbf{w}^T \mathbf{x}_i + b |}{\|\mathbf{w}\|} di=wwTxi+b

该公式表示距离是超平面法向量 w \mathbf{w} w 投影到样本点 x i \mathbf{x}_i xi 上的值,然后用法向量的大小 ∥ w ∥ \|\mathbf{w}\| w 进行归一化。

  • 为什么要归一化?:因为 w \mathbf{w} w 可以通过缩放变大或变小,而几何间隔应该与 w \mathbf{w} w 的缩放无关。通过除以 ∥ w ∥ \|\mathbf{w}\| w,我们消除了法向量的影响,使得这个公式只表示到超平面的实际距离。

通过加入 y i y_i yi,公式 9-3 确保了几何间隔的符号(用于分类方向一致性),并且引入了超平面的法向量归一化,得到了真实的几何间隔。

3. 公式 9-3 的作用

公式 9-3 明确了一个关键点:几何间隔是带符号的距离除以超平面法向量的大小。它揭示了样本点与超平面之间的实际物理距离,反映了分类的置信度。

几何间隔越大,意味着样本点离超平面越远,分类的置信度也就越高。因此,支持向量机的核心思想之一就是最大化最小几何间隔,确保最难分类的样本(即支持向量)与超平面有足够大的距离。

4. 几何间隔与法向量的关系

d i = y i w T x i + b ∥ w ∥ d_i = y_i \frac{\mathbf{w}^T \mathbf{x}_i + b}{\|\mathbf{w}\|} di=yiwwTxi+b

这个公式表明:

  • 几何间隔不仅与样本点的位置相关(通过 x i \mathbf{x}_i xi b b b),还与超平面的法向量大小 ∥ w ∥ \|\mathbf{w}\| w 有关。
  • 如果我们不除以 ∥ w ∥ \|\mathbf{w}\| w,那么法向量的缩放会直接影响带符号距离,使得距离不能准确反映样本与超平面之间的真实物理距离。因此,通过除以 ∥ w ∥ \|\mathbf{w}\| w 进行归一化,我们可以得到一个真正代表物理距离的几何间隔。

5. 总结

公式 9-3 给出了几何间隔的表达式,即每个样本点到分类超平面的真实距离。它是通过带符号距离归一化法向量大小得到的,反映了分类的置信度。支持向量机通过最大化这些几何间隔,确保超平面能够最大化区分不同类别的样本。


http://www.ppmy.cn/server/133730.html

相关文章

CDGA|数据治理:如何让传统行业实现数据智能

在当今这个数字化时代,数据已成为推动各行各业转型升级的关键力量。对于传统行业而言,如何从海量、复杂的数据中挖掘价值,实现“数据智能”,成为了提升竞争力、优化运营效率、创新业务模式的重要途径。本文将探讨数据治理如何助力…

RHCE的学习(3)

第三章 远程登录服务 简介 概念 远程连接服务器通过文字或图形接口方式来远程登录系统,让你在远程终端前登录linux主机以取得可操作主机接口(shell),而登录后的操作感觉就像是坐在系统前面一样 功能: 分享主机的运算能力 服务…

【Hadoop】HDFS基本操作

参考:3.HDFS基本操作_哔哩哔哩_bilibili 创建目录 hadoop fs -mkdir -p /training/qiang查看当前根目录下文件 hadoop fs -ls /hadoop fs -ls /training/目录授权 hadoop fs -chmod -R 777 /training/qm777是最大权限,读写 4、2、1 上传文件 先创…

TDengine 与北微传感达成合作,解决传统数据库性能瓶颈

在当今物联网(IoT)快速发展的背景下,传感器技术已成为各个行业数字化转型的关键组成部分。随着设备数量的激增和数据生成速度的加快,如何高效地管理和分析这些数据,成为企业实现智能化运营的重要挑战。尤其是在惯性传感…

集成方案 | 结合 Microsoft 365 Copilot 与 Docusign,实现 AI 驱动的协议洞察!

使用 Copilot 快速解答你的 Docusign 协议问题。 在 2024 年 9 月,Docusign 宣布与 Microsoft 达成合作,成为首批集成到 Microsoft 365 Copilot 的公司。这一集成使得 Docusign 协议中的信息能够被 Copilot(Microsoft 的通用 AI 助手&#xf…

【重拾算法第一天】质数约数欧拉筛 埃氏筛GCD

1.素数 素数(Prime Number)是指大于1的自然数,只有两个正因数:1和它自身。换句话说,素数是不能被其他自然数整除的数。 1.1小素数的判定 判定一个数是否为素数 ,当N ≤ 时, 用试除法 &#…

【专题】计算机网络之物理层

计算机网络体系结构: 1. 物理层的基本概念 物理层考虑的是怎样才能在连接各种计算机的传输媒体上传输数据比特流,而不是指具体的传输媒体。 作用:尽可能屏蔽掉不同传输媒体和通信手段的差异。 用于物理层的协议也常称为物理层规程 (procedu…

pg的checkpoint相关参数

pg的checkpoint相关参数 checkpoint_timeout checkpoint_timeout是一个关键的配置参数,它用于指定自上次checkpoint之后经过的时间间隔,当超过这个指定的时间后,系统会执行checkpoint操作。 postgres# show checkpoint_timeout;checkpoint…