【Datewhale一起吃瓜 Task4】啃瓜第五章

news/2025/2/14 6:17:05/

支持向量机

任务:找到超平面

在样本空间中,找到最好的超平面把样本分开,即找到正中间的超平面
满足

  • 该超平面 分开了两类
  • 该超平面 最大化支持向量间隔
  • 该超平面处于 间隔中间,到所有支持向量距离相等
    在这里插入图片描述

如何找:表示出间隔求最大化

以二分类为例,决定超平面的样本是离超平面最近的两类样本,称为支持向量。支持向量至少有两个,可能有多个。两类支持向量见的距离称为间隔
在这里插入图片描述
为了方便起见,我们让过两类的支持向量的超平面,称为正负面。我们可以通过代数变换,把正负面的方程变换为
在这里插入图片描述
为什么能这么变换?因为支持向量到最中间超平面(我们想要的)的距离相等
经过上面的变换,我们就能把间隔表示为
γ = 2/ ||w||
在这里插入图片描述
转化为求γ最大即可
在这里插入图片描述
拉格朗日乘子法
在这里插入图片描述

在这里插入图片描述
SMO求解方法
在这里插入图片描述

数据混在一块儿分不出来怎么办

将样本从原始空间映射到更高维的特征空间,使得样本线性可分
在这里插入图片描述
转化后
在这里插入图片描述
总是以内积形式出现,单独算不好处理,考虑设计核函数
在这里插入图片描述

如何找核函数

我们不能找到一个唯一的最优函数来替代φφT,只能从核函数集合中选择一个
在这里插入图片描述

缓解过拟合:软间隔

引入软间隔,允许在一些样本上不满足约束
在这里插入图片描述
在这里插入图片描述
由于0/1函数不易优化,我们选择一个替代函数
在这里插入图片描述
引入拉格朗日乘子法求解
在这里插入图片描述

应用

在这里插入图片描述


http://www.ppmy.cn/news/19902.html

相关文章

阿里云服务器Centos7搭建java web环境

阿里云服务器Centos7搭建java web环境 1.版本信息 JDK > 1.8 (推荐1.8版本) nginx > 1.21.0 Mysql > 5.7 (推荐5.7版本)2.jdk安装 2.1 使用yum安装jdk8 yum install java-1.8.0-openjdk-devel.x86_642.2 添加到环境变量 vi /etc/profile # 在export PATH USER LO…

基于Python实现的图像文字识别OCR工具,包含GUI界面附完整版代码可直接运行

引言 最近在技术交流群里聊到一个关于图像文字识别的需求,在工作、生活中常常会用到,比如票据、漫画、扫描件、照片的文本提取。 博主基于 PyQt + labelme + PaddleOCR 写了一个桌面端的 OCR 工具,用于快速实现图片中文本区域自动检测 + 文本自动识别。 识别效果如下图所示:…

Python---库的使用

专栏:python 个人主页:HaiFan. 专栏简介:本专栏主要更新一些python的基础知识,也会实现一些小游戏和通讯录,学时管理系统之类的,有兴趣的朋友可以关注一下。 库前言标准库使用import导入模块例1例2例3 文件…

阿里“云开发“小程序(uniCloud)

博主ps: 网上资料少的可怜,哎,腾讯云涨价了,论服务器,我肯定选的阿里,再着你们对比下uniCloud的报价就知道了,如果有钱就另当别论了。 所以这片博文,博主试过之后,先抛出…

UE Operation File [ Read / Write ] DTOperateFile 插件说明

蓝图直接操作文件的功能节点 可以获取文件基本信息以及读写文件 目录 1. File Exists 2. File Size 3. File Delete 4. File Is Read Only 5. File Move 6. File Save By String 7. File Save By Array String 8. File Save By Array Binary 9. File Append By Strin…

蓝桥杯2021省赛Python

蓝桥杯2021省赛Python 不得不说2021的比2020的难 1.卡片 很明显,最先没的肯定是1或者0,我们只要统计到谁会消耗2022个1或者0就好了 if __name__ __main__:res1 0res0 0for i in range(1,100000):i str(i)res1 i.count(1)res0 i.count(0)if res1…

nodejs+vue高校网上报名系统

本课题利用nodejsVue设计实现网上报名系统。系统的主要功能是:用户在线注册信息之后,利用注册时填写的用户账号与密码,登入系统后,对注册的个人信息进行修改,在线报名,能正确的提交有送报考的基本信息&…

迭代次数的分界线

( A, B )---4*30*2---( 1, 0 )( 0, 1 ) 做一个网络,输入为4个点,训练集A,B各有两张图片。让B的两张图片全是0.排列组合A,记录迭代次数平均值的变化。 如 差值结构 A-B 迭代次数 1 0 0 0 8*15-0*0 5609.6533 1 1 1 1 8*15-0*0 …