线性可分支持向量机的原理推导 最大化几何间隔d 公式解析

devtools/2024/10/23 1:16:23/

本文是将文章《线性可分支持向量机的原理推导》中的公式单独拿出来做一个详细的解析,便于初学者更好的理解。


公式 9-4 为:

max ⁡ w , b d \max_{\mathbf{w}, b} \quad d w,bmaxd

subject to y i ( w ⋅ x i + b ∥ w ∥ ) ≥ d , i = 1 , 2 , ⋯ , N \text{subject to} \quad y_i \left( \frac{\mathbf{w} \cdot \mathbf{x}_i + b}{\|\mathbf{w}\|} \right) \geq d, \quad i = 1, 2, \cdots, N subject toyi(wwxi+b)d,i=1,2,,N

现在我们来详细解释这个正确的公式 9-4。

1. 公式 9-4 的含义

这个公式描述了支持向量机中的最大化分类间隔的问题。公式中的目标是最大化几何间隔 d d d,并且所有样本点都必须满足约束条件。具体地:

  • 目标函数 max ⁡ w , b d \max_{\mathbf{w}, b} \, d maxw,bd 表示我们希望找到一个使几何间隔 d d d 最大的 w \mathbf{w} w b b b
  • 约束条件 y i ( w ⋅ x i + b ∥ w ∥ ) ≥ d y_i \left( \frac{\mathbf{w} \cdot \mathbf{x}_i + b}{\|\mathbf{w}\|} \right) \geq d yi(wwxi+b)d,表示每个样本点 x i \mathbf{x}_i xi 到超平面的几何距离至少为 d d d,同时确保它们被正确分类。
几何间隔解释:

几何间隔是样本点到超平面的距离,在支持向量机中,目标是最大化这个几何间隔,即找到一个最能有效分离不同类别的超平面。

2. 公式推导中的关键

这个公式中的几何间隔 d d d 通过以下方式表示:
w ⋅ x i + b ∥ w ∥ \frac{\mathbf{w} \cdot \mathbf{x}_i + b}{\|\mathbf{w}\|} wwxi+b

其中:

  • w ⋅ x i + b \mathbf{w} \cdot \mathbf{x}_i + b wxi+b 表示超平面的分类函数,决定了样本点 x i \mathbf{x}_i xi 与超平面的相对位置。
  • ∥ w ∥ \|\mathbf{w}\| w 是超平面法向量 w \mathbf{w} w 的范数,表示分类超平面的陡峭程度。

通过将样本点的分类函数归一化为 ∥ w ∥ \|\mathbf{w}\| w,可以确保公式计算的是几何意义上的实际距离,而不是受法向量大小影响的带符号距离。

3. 约束条件的意义

约束条件:
y i ( w ⋅ x i + b ∥ w ∥ ) ≥ d , i = 1 , 2 , ⋯ , N y_i \left( \frac{\mathbf{w} \cdot \mathbf{x}_i + b}{\|\mathbf{w}\|} \right) \geq d, \quad i = 1, 2, \cdots, N yi(wwxi+b)d,i=1,2,,N

确保了每个样本点 x i \mathbf{x}_i xi 的分类结果与它的真实类别 y i y_i yi 一致。具体来说:

  • 对于 y i = + 1 y_i = +1 yi=+1 的正类样本,约束条件要求 w ⋅ x i + b ≥ ∥ w ∥ d \mathbf{w} \cdot \mathbf{x}_i + b \geq \|\mathbf{w}\| d wxi+bwd,也就是说,正类样本位于超平面的“正侧”且距离至少为 d d d
  • 对于 y i = − 1 y_i = -1 yi=1 的负类样本,约束条件要求 w ⋅ x i + b ≤ − ∥ w ∥ d \mathbf{w} \cdot \mathbf{x}_i + b \leq -\|\mathbf{w}\| d wxi+bwd,负类样本位于超平面的“负侧”且距离至少为 d d d

因此,这个约束确保了所有样本点不仅被正确分类,而且它们与超平面的距离不小于 d d d

4. 间隔最大化的思想

支持向量机的核心思想是最大化最小间隔,即找到一个超平面,使得最靠近超平面的样本点(即支持向量)到超平面的距离 d d d 尽可能大。在这个公式中,目标是直接最大化这个最小间隔 d d d,在保证分类约束条件的情况下。

5. 公式 9-4 的进一步简化

接下来的推导中,最大化几何间隔 d d d 的优化问题可以进一步简化。因为几何间隔的绝对值 d d d 实际上不会影响问题的求解,因此在后续公式中我们可以假设 d = 1 d = 1 d=1,将问题简化为:
min ⁡ w , b 1 2 ∥ w ∥ 2 \min_{\mathbf{w}, b} \quad \frac{1}{2} \|\mathbf{w}\|^2 w,bmin21w2

subject to y i ( w ⋅ x i + b ) ≥ 1 , i = 1 , 2 , ⋯ , N \text{subject to} \quad y_i (\mathbf{w} \cdot \mathbf{x}_i + b) \geq 1, \quad i = 1, 2, \cdots, N subject toyi(wxi+b)1,i=1,2,,N
这就是支持向量机优化问题的标准形式,即最小化法向量的范数 ∥ w ∥ \|\mathbf{w}\| w 的平方,同时确保所有样本点满足分类约束。

总结

公式 9-4 的目的是最大化几何间隔 d d d,确保每个样本点与超平面的距离至少为 d d d 且被正确分类。这是支持向量机的核心思想,后续通过固定 d = 1 d = 1 d=1 来简化优化问题,从而得到最小化 w \mathbf{w} w 的范数的最终优化形式。


http://www.ppmy.cn/devtools/128005.html

相关文章

【FAQ】HarmonyOS SDK 闭源开放能力 —Map Kit(3)

1.问题描述: compatibleSdkVersion升级到5.0.0(12)之后,调用坐标系转换API:map.convertCoordinate(mapCommon.CoordinateType.WGS84, mapCommon.CoordinateType.GCJ02, { longitude: location.longitude, latitude:…

iframe token 通信。iframe 子应用无法收到 message

问题描述 父应用内嵌 iframe 子应用,需要在一开始传递 token。这种情况下监听 message 的时机(代码放置的位置很重要),否则可能出现获取不到 message 的问题。 如果采用等子应用加载完,再 postMessage 给父应用&…

【Flutter】配置:远程开发

在Linux云服务器上配置Flutter的Web开发环境主要包括安装Flutter SDK、配置环境变量、安装所需的依赖项,以及确保你的服务器可以访问Flutter开发所需的工具。以下是详细步骤: 安装依赖项 首先,更新包管理器并安装必要的依赖项。打开终端并运…

SpringBoot框架下的桂林旅游资源整合

4系统概要设计 4.1概述 本系统采用B/S结构(Browser/Server,浏览器/服务器结构)和基于Web服务两种模式,是一个适用于Internet环境下的模型结构。只要用户能连上Internet,便可以在任何时间、任何地点使用。系统工作原理图如图4-1所示: 图4-1系统工作原理…

关于k8s集群高可用性的探究

1. k8s的高可用的核心是什么? 说到核心、本质 意味着要从物理层来考虑技术 k8s是一个容器编排管理工具,k8s受欢迎的时机 是docker容器受欢迎时,因为太多的docker容器,管理起来是一个大工程 那么刚好k8s是google自己用了十来年…

web网页QQ登录

代码&#xff1a; <head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0"><title>QQ登录ent</title> </head> <style>ul > li{list-style: none; } a …

2024软件测试面试大全(答案+文档)

&#x1f345; 点击文末小卡片&#xff0c;免费获取软件测试全套资料&#xff0c;资料在手&#xff0c;涨薪更快 一、软件测试基础面试题 1、阐述软件生命周期都有哪些阶段? 常见的软件生命周期模型有哪些? 软件生命周期是指一个计算机软件从功能确定设计&#xff0c;到…

百度地图如何添加店铺位置?

在这个信息化时代&#xff0c;任何店铺若要实现更好的发展&#xff0c;都无法脱离信息的传播。简而言之&#xff0c;店铺需要对自身进行宣传&#xff0c;提升知名度。只有让更多的人知晓店铺的存在&#xff0c;才能够获取更多的客流量。而想要提升店铺的曝光度和知名度&#xf…