朴素贝叶斯方法

server/2025/1/7 19:30:48/

一般来说训练时的一个实例有很多属性用一个<a1,a2,....,an>来表示一个数据,那么此时根据最大后验概率的计算公式可以得出:

                  

        其中, H 是目标值集合。 估计每个 P(hi)很容易, 只要计算每个目标值 hi出现在训练数据
中的频率就可以。 但是如果要如此估计所有的 P( a1 ,a2 ,…,an hi)项, 则必须计算 a1 ,a2 ,…,an的所有可能取值组合, 再乘以可能的目标值数量。 假设一个实例有 10 个属性, 每个属性有3 个可能取值, 而目标集合中有 5 个候选目标, 那么 P(a1 ,a2 ,…,an hi)项就有 5×3^10个之多。对于现实系统这样显然不行。 因为, 首先我们很难得到一个容量足够大的样本; 其次即使样本足够多, 进行统计的时间复杂度也是无法忍受的。 所以, 贝叶斯最优假设 (包括贝叶斯最优分类器) 不适合于高维数据。

        所以提出了朴素贝叶斯和贝叶斯网络来解决高维数据问题。下面介绍朴素贝叶斯方法。

        朴素贝叶斯方法假设如下:对于目标值, 数据各属性之间是相互条件独立的, 即 a1 ,a2 ,…,an的联合概率等于每个单独属性的概率乘积。

                                       P(a_{1},a_{2},...,a_{n})=\prod_{j}^{} P(a_{j} | h_{j})

         即朴素贝叶斯方法公式为:

                              

        将计算数据缩小到了5x3x10。当各个属性条件独立性满足时,朴素贝叶斯分类结果等于最大后验概率分类结果。


http://www.ppmy.cn/server/156568.html

相关文章

【计算机网络安全】CA和安全电子邮件

实验四 网络安全应用&#xff08;加密解密2&#xff09; 实验人员&#xff1a;第五组全体成员 实验目的&#xff1a; 1&#xff1a;学习使用MD5加密破解软件。 2&#xff1a;理解字符串和文件的加密解密的原理和方法。 3&#xff1a;理解邮件的加密解密的原理和方法。 …

《Opencv》基础操作详解(5)

接上篇&#xff1a;《Opencv》基础操作详解&#xff08;4&#xff09;-CSDN博客 目录 接上篇&#xff1a;《Opencv》基础操作详解&#xff08;4&#xff09;-CSDN博客 25、轮廓近似 简介 接口用法 参数说明 返回值 代码示例 结果展示 26、轮廓最小外接圆 简介 接口用…

2025第1周 | JavaScript中的正则表达式

目录 1. 正则表达式是个什么东东&#xff1f;1.1 怎么定义正则1.2 对象字面量方式1.3 类创建方式 2. 怎么使用2.1 实例方法2.1.1 exec方法2.1.2 test方法 2.2 字符串中的方法2.2.1 match/matchAll2.2.2 replace/replaceAll2.2.3 split2.2.4 search 3. 规则3.1 修饰符3.2 字符类…

依据多波段栅格数据进行建筑统计操作(基于ArcGIS操作)

1 操作软件 ArcMap 10.8&#xff08;3.1&#xff09; ArcGIS Pro&#xff08;3.2和3.3&#xff09; 2 操作任务 3 操作步骤 3.1 将影像数据进行分割&#xff08;即输出每一单波段影像数据&#xff09; 预处理工作&#xff1a;由于时序人口的栅格数据空间范围远大于待提取的…

计算机网络第五章--运输层--课后习题

1.连续ARQ协议 【5-21】 假定使用连续ARQ 协议&#xff0c;发送窗口大小是3,而序号范围是[0,15],而传输媒 体保证在接收方能够按序收到分组。在某一时刻&#xff0c;在接收方&#xff0c;下一个期望收到的 序号是5。试问&#xff1a; (1)在发送方的发送窗口中可能出现的序号组…

Tailwind CSS 实战:动画效果设计与实现

在现代网页设计中,动画效果就像是一位优秀的舞者,通过流畅的动作为用户带来愉悦的视觉体验。记得在一个产品展示网站项目中,我们通过添加精心设计的动画效果,让用户的平均停留时间提升了 35%。今天,我想和大家分享如何使用 Tailwind CSS 打造优雅的动画效果。 设计理念 设计动…

如何进一步提高Oracle lgwr的写性能?

今天在我们的一个项目中&#xff0c;客户非常关系Oracle的log file sync、db file parallel write性能。 由于我们的分布式存储zdatax已经是nvme了&#xff0c;因此db file parallel write的性能足够好了&#xff0c;平均等待时间也就0.13ms。 然后log file sync 确高达0.6ms…

redis解决高并发抢购

对于前后端不分离的程序可以用悲观锁&#xff0c;对于前后端分离的程序可以用redis分布式锁 分布式锁 setnx key value&#xff0c;将key设置为value&#xff0c;当键不存在时&#xff0c;才能成功&#xff0c;若键存在&#xff0c;什么也不做&#xff0c;成功返回1&#xff0…