sheng的学习笔记-AI-生成式方法

server/2024/9/23 7:30:32/

 AI目录:sheng的学习笔记-AI目录-CSDN博客

需要额外的知识对应连接:

EM:sheng的学习笔记-AI-EM算法-CSDN博客

贝叶斯: sheng的学习笔记-AI-贝叶斯(Bayesian)分类-CSDN博客

高斯混合模型:sheng的学习笔记-AI-高斯混合模型(GMM)-CSDN博客

什么是生成式方法

生成式方法(generative methods)是直接基于生成式模型的方法。此类方法假设所有数据(无论是否有标记)都是由同一个潜在的模型“生成”的。这个假设使得我们能通过潜在模型的参数将未标记数据与学习目标联系起来,而未标记数据的标记则可看作模型的缺失参数,通常可基于EM算法进行极大似然估计求解。此类方法的区别主要在于生成式模型的假设,不同的模型假设将产生不同的方法

给定样本x,其真实类别标记为y∈Y,其中Y={1,2,...,N}为所有可能的类别。假设样本由高斯混合模型生成,且每个类别对应一个高斯混合成分。换言之,数据样本是基于如下概率密度生成:

 

 假设类簇与真实的类别按照顺序一一对应,即第i个类簇对应第i个高斯混合成分。与高斯混合聚类类似地,这里的主要任务也是估计出各个高斯混合成分的参数以及混合系数,不同的是:对于有标记样本,不再是可能属于每一个类簇,而是只能属于真实类标对应的特定类簇。

给定有标记样本集Dl={(x1,y1),(x2,y2),...,(xl,yl)}和未标记样本集Du={xl+1,xl+2,...,xl+u},l≪u,l+u=m.假设所有样本独立同分布,且都是由同一个高斯混合模型生成的。用极大似然法来估计高斯混合模型的参数的对数似然是

公式由两项组成:基于有标记数据Dl的有监督项和基于未标记数据Du的无监督项。显然,高斯混合模型参数估计可用EM算法求解,迭代更新式如下:

以上过程不断迭代直至收敛 

对于待预测样本x,便可以像贝叶斯分类器那样计算出样本属于每个类簇的后验概率,接着找出概率最大的即可

将上述过程中的高斯混合模型换成混合专家模型、朴素贝叶斯模型 等即可推导出其他的生成式半监督学习方法。此类方法简单,易于实现,在有标记数据极少的情形下往往比其他方法性能更好。然而,此类方法有一个关键:模型假设必须准确,即假设的生成式模型必须与真实数据分布吻合;否则利用未标记数据反倒会降低泛化性能​。遗憾的是,在现实任务中往往很难事先做出准确的模型假设,除非拥有充分可靠的领域知识

 

参考文章:14 半监督学习 - 14.1 生成式方法 - 《周志华《机器学习》学习笔记》 - 书栈网 · BookStack

书:机器学习 


http://www.ppmy.cn/server/105998.html

相关文章

es 7.17.23安装ik插件启动失败,access denied,Permission

情况简述 windows平台,下载了7.17.23的es以及7.17.23的ik分词器的zip包之后( 下载地址(官方推荐的):Index of: analysis-ik/stable/ ),解压该ik的包到es的plugins下,目录结构&…

appium学习记录

免责声明 本文内容仅供参考,将appuim与爬虫技术相结合可能违反某些app的使用条款和法律法规。作者不对因此产生的法律问题或技术风险负责。建议读者在进行爬取操作前,充分了解相关法律法规并确保合规。 1、初识appium 背景:部分APP需要反编译…

5步掌握“花开富贵”花园管理系统开发——基于Python Django+Vue

🍊作者:计算机毕设匠心工作室 🍊简介:毕业后就一直专业从事计算机软件程序开发,至今也有8年工作经验。擅长Java、Python、微信小程序、安卓、大数据、PHP、.NET|C#、Golang等。 擅长:按照需求定制化开发项目…

STL(标准模板库)---算法

目录 一、引言 二、STL算法概述 三、常用STL算法实例解析 1.查找算法 2.排序算法 3.替换算法 四、总结 本文将带领大家了解C STL(标准模板库)中的算法部分,通过实例讲解常用算法的使用方法,帮助读者掌握STL算法的强大功能&…

利用TeamCity实现maven项目的CI/CD

1.什么是TeamCity? TeamCity 是一款由 JetBrains 开发的强大的持续集成(Continuous Integration,CI)和持续部署(Continuous Deployment,CD)工具。它帮助开发团队自动化构建、测试和部署过程&am…

PHP酒店宾馆民宿预订系统小程序源码

酒店宾馆民宿预订系统:一键解锁完美旅行住宿新体验 🌟 开篇:告别繁琐,拥抱便捷预订新时代 在这个快节奏的时代,每一次旅行的规划都希望能尽可能高效与省心。想象一下,在规划一场说走就走的旅行时&#xf…

如何快速对影像进行分幅?

GIS数据转换器的"分割转换"功能,可以根据用户设定的像素大小将一幅大影像分割成若干小尺寸的影像。下面是详细的使用步骤: 方法/步骤 1. 数据准备 支持tif、img、bmp文件格式。 2. 软件下载与安装 从GeoSaaS.COM官网下载并安装 GIS数据转换…

解密网络安全:初学者指南

密码学是网络安全的基石,它不仅确保数据的机密性,还能保护数据的完整性和不可否认性。本文将带领你了解密码学的基本概念以及它在保护数据机密性中的应用。 什么是密码学? 当我们通过计算机网络传输数据时,如果无法防止他人窃听…