线性可分支持向量机的原理推导 转为拉格朗日函数式 公式解析

embedded/2024/10/23 2:49:55/

本文是将文章《线性可分支持向量机的原理推导》中的公式单独拿出来做一个详细的解析,便于初学者更好的理解。


公式 9-7 引入了拉格朗日乘子法,这是支持向量机(SVM)优化问题的重要步骤,目的是将原来的带有约束条件的优化问题转化为一个更容易求解的无约束优化问题。

公式 9-7 的形式如下:

L ( w , b , α ) = 1 2 ∥ w ∥ 2 − ∑ i = 1 N α i [ y i ( w T x i + b ) − 1 ] L(\mathbf{w}, b, \alpha) = \frac{1}{2} \|\mathbf{w}\|^2 - \sum_{i=1}^{N} \alpha_i \left[ y_i (\mathbf{w}^T \mathbf{x}_i + b) - 1 \right] L(w,b,α)=21w2i=1Nαi[yi(wTxi+b)1]

1. 公式 9-7 的含义

这个公式表示的是拉格朗日函数,它结合了原优化目标(最小化 ∥ w ∥ 2 \|\mathbf{w}\|^2 w2)和分类约束条件,通过引入拉格朗日乘子 α i \alpha_i αi 来处理约束问题。

拉格朗日函数的组成部分:
  • 第一项 1 2 ∥ w ∥ 2 \frac{1}{2} \|\mathbf{w}\|^2 21w2

    • 这是原始的优化目标,即最小化法向量 w \mathbf{w} w 的范数平方。目的是通过最小化这个值来最大化分类间隔。
  • 第二项 − ∑ i = 1 N α i [ y i ( w T x i + b ) − 1 ] - \sum_{i=1}^{N} \alpha_i \left[ y_i (\mathbf{w}^T \mathbf{x}_i + b) - 1 \right] i=1Nαi[yi(wTxi+b)1]

    • 这一项引入了 拉格朗日乘子 α i \alpha_i αi,用于将原约束条件 y i ( w T x i + b ) ≥ 1 y_i (\mathbf{w}^T \mathbf{x}_i + b) \geq 1 yi(wTxi+b)1 结合到目标函数中。通过引入拉格朗日乘子,约束条件变成了优化目标中的一部分。
    • α i ≥ 0 \alpha_i \geq 0 αi0 是拉格朗日乘子,对应于每一个样本点 i i i
    • [ y i ( w T x i + b ) − 1 ] \left[ y_i (\mathbf{w}^T \mathbf{x}_i + b) - 1 \right] [yi(wTxi+b)1] 表示对分类约束的偏离。对于正确分类的点,这个值应该大于或等于 0;否则,分类约束会被违反。

2. 拉格朗日乘子法的作用

支持向量机的优化问题中,我们原本要处理一个带有约束条件的优化问题。为了将这个问题转化为更容易处理的形式,我们使用拉格朗日乘子法将约束条件纳入优化目标中。

  • 原优化问题是:
    min ⁡ w , b 1 2 ∥ w ∥ 2 \min_{\mathbf{w}, b} \quad \frac{1}{2} \|\mathbf{w}\|^2 w,bmin21w2
    subject to y i ( w T x i + b ) ≥ 1 , i = 1 , 2 , … , N \text{subject to} \quad y_i (\mathbf{w}^T \mathbf{x}_i + b) \geq 1, \quad i = 1, 2, \ldots, N subject toyi(wTxi+b)1,i=1,2,,N

  • 通过拉格朗日乘子法,我们将约束条件 y i ( w T x i + b ) ≥ 1 y_i (\mathbf{w}^T \mathbf{x}_i + b) \geq 1 yi(wTxi+b)1 用拉格朗日乘子 α i \alpha_i αi 表示出来,构造了拉格朗日函数 L ( w , b , α ) L(\mathbf{w}, b, \alpha) L(w,b,α)

这使得原始的带约束优化问题变成了一个无约束优化问题,我们可以通过同时对 w , b , α \mathbf{w}, b, \alpha w,b,α 求最优解来处理这个问题。

3. 拉格朗日函数中的每个部分详解

  • 第一项 1 2 ∥ w ∥ 2 \frac{1}{2} \|\mathbf{w}\|^2 21w2

    • 这个部分是原始的目标函数,目的是最小化法向量的范数,以最大化分类间隔。
  • 第二项 ∑ i = 1 N α i [ y i ( w T x i + b ) − 1 ] \sum_{i=1}^{N} \alpha_i \left[ y_i (\mathbf{w}^T \mathbf{x}_i + b) - 1 \right] i=1Nαi[yi(wTxi+b)1]

    • 这里的每个 α i \alpha_i αi 是对应第 i i i 个样本点的拉格朗日乘子。
    • 对于每个 i i i,如果分类约束 y i ( w T x i + b ) ≥ 1 y_i (\mathbf{w}^T \mathbf{x}_i + b) \geq 1 yi(wTxi+b)1 被满足,那么 α i \alpha_i αi 会取 0;如果不满足,拉格朗日乘子 α i \alpha_i αi 会影响最终的优化目标。
    • α i ≥ 0 \alpha_i \geq 0 αi0 表示这个乘子是非负的。对于那些不影响分类间隔的样本点, α i = 0 \alpha_i = 0 αi=0;对于支持向量, α i \alpha_i αi 会大于 0,因为它们对分类结果起到关键作用。

4. 拉格朗日对偶问题

构造拉格朗日函数的目的是将带有约束条件的优化问题转化为一个无约束优化问题。接下来,我们通过拉格朗日对偶问题来进一步简化求解过程。

  • 原始问题(Primal Problem):

    • 即公式 9-6 中的带约束的最小化问题。
  • 对偶问题(Dual Problem):

    • 通过构造拉格朗日函数并对 w , b \mathbf{w}, b w,b 求解对偶问题(即找到最优的 w , b \mathbf{w}, b w,b),我们可以将原问题的复杂度大大降低。对偶问题中的优化变量变为拉格朗日乘子 α \alpha α,这将使得问题的求解更加高效。

5. 公式 9-7 的求解步骤

  • 第一步:构造拉格朗日函数,如公式 9-7 所示,将优化目标与约束条件结合起来。
  • 第二步:通过对 w \mathbf{w} w b b b 求导,找到拉格朗日对偶问题。
  • 第三步:通过对拉格朗日乘子 α \alpha α 进行优化,最终求得支持向量机的最优解。

6. 公式 9-7 的作用

公式 9-7 是支持向量机求解过程中的关键一步,它通过拉格朗日乘子法将原有的带约束的优化问题转化为无约束优化问题,并且将分类约束通过拉格朗日乘子的形式整合到目标函数中。这样一来,我们可以更有效地处理这个问题,并通过求解拉格朗日对偶问题找到最优的分类超平面。

总结

  • 公式 9-7 引入了拉格朗日函数,目的是将支持向量机的带约束优化问题转化为无约束问题。
  • 拉格朗日乘子 α i \alpha_i αi 用来处理分类约束,确保样本点被正确分类且间隔最大化。
  • 通过对拉格朗日函数求解对偶问题,我们可以找到支持向量机的最优解,并构造出最终的分类超平面。

http://www.ppmy.cn/embedded/129714.html

相关文章

什么是大数据分析:定义、优缺点、应用、机遇和风险

大数据分析的概念已经成为我们社会不可或缺的一部分。众多公司和机构已经开发了大数据应用程序,取得了不同程度的成功。社交媒体平台和传感器等技术正在以前所未有的速度生成数据,就像一条装配线。如今,几乎所有东西都是物联网的一部分&#…

【从零开始的LeetCode-算法】945. 使数组唯一的最小增量

给你一个整数数组 nums 。每次 move 操作将会选择任意一个满足 0 < i < nums.length 的下标 i&#xff0c;并将 nums[i] 递增 1。 返回使 nums 中的每个值都变成唯一的所需要的最少操作次数。 生成的测试用例保证答案在 32 位整数范围内。 示例 1&#xff1a; 输入&am…

JavaSE之多态

文章目录 多态的概念多态的实现条件向上转型动态绑定静态绑定向下转型Object类 给个关注叭        个人主页 JavaSE专栏 前言&#xff1a;本篇文章主要整理了多态的概念、实现条件、多态性的体现、向上转型、向下转型、动态绑定和静态绑定以及Object类中的equals、toStri…

路由器概述

一、路由器的工作原理 根据路由表转发数据 二、路由表与其形成 2.1路由表 &#xff08;1&#xff09;概念 路由&#xff1a;从源主机到目的主机的转发过程路由表&#xff1a;路由器中维护的路由条目的集合&#xff1b;路由器根据路由表做路径选择 &#xff08;2&#xff…

支持向量机SVM原理详解

SVM原理详解 1、超平面2、SVM原理1. 问题定义2. 分类决策得到约束条件 3. 最大化间隔4. 优化目标 3、凸优化问题1. 原始优化问题优化目标约束条件 2. 拉格朗日乘子法3. 拉格朗日函数分析4. 求解对 w w w 和 b b b 的极值5. 构造对偶问题对偶问题的约束条件&#xff1a; 6、通…

【含文档】基于ssm+jsp的旧物交易平台(含源码+数据库+lw)

1.开发环境 开发系统:Windows10/11 架构模式:MVC/前后端分离 JDK版本: Java JDK1.8 开发工具:IDEA 数据库版本: mysql5.7或8.0 数据库可视化工具: navicat 服务器: apache tomcat 主要技术: Java,Spring,SpringMvc,mybatis,mysql,vue 2.视频演示地址 3.功能 系统定义了两个…

【原创】java+springboot+mysql校园留言墙管理系统设计与实现

个人主页&#xff1a;程序猿小小杨 个人简介&#xff1a;从事开发多年&#xff0c;Java、Php、Python、前端开发均有涉猎 博客内容&#xff1a;Java项目实战、项目演示、技术分享 文末有作者名片&#xff0c;希望和大家一起共同进步&#xff0c;你只管努力&#xff0c;剩下的交…

【JavaEE初阶】网络编程TCP协议实现回显服务器以及如何处理多个客户端的响应

前言 &#x1f31f;&#x1f31f;本期讲解关于TCP/UDP协议的原理理解~~~ &#x1f308;感兴趣的小伙伴看一看小编主页&#xff1a;GGBondlctrl-CSDN博客 &#x1f525; 你的点赞就是小编不断更新的最大动力 &#x1f386;那么废话不多说…