ccc-Classification-李宏毅(4)

news/2024/11/20 7:20:19/

文章目录

        • Classification 概念
        • Example Application
          • How to do Classification
          • Why not Regesssion
          • Probability from Class - Feature
          • Probability from Class
          • How’s the results?
          • Modifying Model
          • Three Steps
        • Probability Distribution

Classification 概念

本质是找一个函数,输入对象X后输出其所属类别Class,实际应用如下:
在这里插入图片描述

Example Application

以神奇宝贝属性分类(Water/79 和 Normal/61)进行推进,function中input数据来源如下:
在这里插入图片描述

How to do Classification

数据通过函数中计算后返回判断类别结果,loss函数返回训练集汇总出现的错误,然后选择最优模型
idea图如下(二分类):
在这里插入图片描述

Why not Regesssion

在这里插入图片描述
存在的问题:

  • 回归用一条线,但问题是非常正确的样本将分界线过度纠正导致效果不好
  • Regression返回的是连续值,classification返回离散的点,性质不同
Probability from Class - Feature

只考虑Defense和SP Defence这两种feature,并认为样本点符合高斯分布(正态分布)注意海龟不在训练集中
在这里插入图片描述
高斯分布的简单介绍

公式如下:
fμ,Σ(x)=1(2π)D/21∣Σ∣1/2exp{−12(x−μ)TΣ−1(x−μ)}f_{\mu,\Sigma}(x)=\frac{1}{(2\pi)^{D/2}}\frac{1}{|\Sigma|^{1/2}}exp\{-\frac{1}{2}(x-\mu)^T\Sigma^{-1}(x-\mu)\}fμ,Σ(x)=(2π)D/21∣Σ1/21exp{21(xμ)TΣ1(xμ)}
其中,μ\muμ表示均值,Σ\SigmaΣ表示协方差(covariance),它们对于分布的影响如下:

  • 不同的μ\muμ相同的Σ\SigmaΣ概率分布最高点不同
  • 相同μ\muμ不同的Σ\SigmaΣ,概率最高点相同,分散程度不同
    在这里插入图片描述
Probability from Class

将海龟的数据代入由之前的79个资料形成的高斯分布中就可以估测它所属类别的概率。通过极大似然函数寻找这个高斯分布:

在这里插入图片描述
分别计算两种类别最佳高斯分布参数:
在这里插入图片描述
将这些得到的数据进行代入分类公式(设定阈值0.5):
在这里插入图片描述

How’s the results?

在这里插入图片描述
左图是训练集右图是测试集,结果47% accuracy,效果非常差。即使使用所有的6种数据集accuracy也仅仅54%。

Modifying Model

考虑可能是参数过多导致过拟合,比较好的解决方式是公用一个covariance matrix,因为它在样本数量较多时增长非常迅速(与feature size的平方成正比)然后造成过拟合,使用相同协方差过程如下:
在这里插入图片描述
在这里插入图片描述
效果得到了显著提升,并且边界变成了线性的。为什么?鬼知道!

Three Steps

在这里插入图片描述

Probability Distribution

在这里插入图片描述
sigmoid function:
在这里插入图片描述在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
上面推导解释为何分类的边界线变成了线性的


http://www.ppmy.cn/news/24179.html

相关文章

python自动发送邮件实现

目录1 前言2 准备工作2.1 电子邮件的基础知识。2.2 python邮件库2.3 邮箱设置3 python实现邮件自动发送3.1 SMTP()和send()方法介绍3.2 python实现实例参考信息1 前言 python功能强大,可以实现我们日常办公的很多任务。诸如批量处理word,excel,pdf等等文件&#xf…

1.2(完结)C语言进阶易忘点速记

1.大端存储:高权位数字放在低地址处,低权位数字放在高地指处。(以字节为单位) 2.小端存储:低权位数字放在低地址处,高权位数字放在高地址处。(以字节为单位) 3.变量(char类型)进行运算的时候一定要注意整形提升与截断&#xff0…

姿态估计端到端新方案 | DirectMHP:用于全范围角度2D多人头部姿势估计

前言 现有的头部姿势估计主要集中在具有预先检测到的正面头部的单个人,这依赖于单独训练的面部检测器,不能很好地泛化到完整的视点。在本文中,作者关注全范围 MPHPE 问题,并提出了一个名为 DirectMHP 的直接端到端简单基线&#x…

Element UI框架学习篇(五)

Element UI框架学习篇(五) 1 准备工作 1.1 在zlz包下创建数据传输对象类EmpDTO package com.zlz.dto;import lombok.AllArgsConstructor; import lombok.Data; import lombok.NoArgsConstructor;//根据前台来的 Data public class EmpDTO {private String name;private Stri…

oralce查找返回不同的值,寻找不同的表(原创)

查找返回不同的值,寻找不同的表 select case a_id when 1 then (select b_id|| ||b_desc from b where b.b_ida.a_id) else (select e_id || ||e_desc from e where e.e_ida.a_id) end from a; 以上方法的缺陷是单表,判断。今天来了个挑战&#…

西湖论剑 2023 比赛复现

WEB real_ez_node 在 route/index.js 中: router.post(/copy,(req,res)>{res.setHeader(Content-type,text/html;charsetutf-8)var ip req.connection.remoteAddress;console.log(ip);var obj {msg: ,}if (!ip.includes(127.0.0.1)) {obj.msg"only for…

第44章 用户密码实体及其约束规则的定义实现

1 说明: 由当前程序需要兼容实现多种用户密码的加密操作,所以必须把“CustomerPassword”定义为实体类,该类用于用于把加密方式、密钥及其加密后的密码持久化到“CustomerPassword”表中,以便用为用户登录操作提供验证支撑。 如果…

ubuntu20.04安装docker与docker-compose

安装docker 查看系统发行版本 cat /proc/version1、更新apt包 sudo apt-get update2、安装必备的软件包以允许apt通过 HTTPS 使用存储库(repository): sudo apt-get install ca-certificates curl gnupg lsb-release3、添加Docker官方版本…