一、分类算法
1. 朴素贝叶斯(Naive Bayesian Classifier)
朴素贝叶斯算法属于传统机器学习中非常经典的分类算法之一,具体的算法流程可以参考之前的blog:https://blog.csdn.net/m0_51339444/article/details/126436309
我们所熟悉的神经网络,支持向量机和Logistic Regression,决策树等都是判别模型;而朴素贝叶斯和隐马尔可夫模型则属于生成式模型。
优点:(1)逻辑简单,易于实现;(2)所需估计的参数较少;(3)性能稳定,算法健壮性好。
缺点:在属性个数比较多或者属性之间相关性较大时,NBC 模型的分类效果相对较差(这是因为属性过多时计算复杂度较高,并且NBC算法本来假设就是各个属性相互独立,当属性之间相关性较大时固然会对分类效果产生很大影响)。
2. 线性判别分析(Linear Discriminant Analysis)
LDA是有监督的成分分析方法,寻找可分性最大意义下的最优线性映射,即充分保留样本的类别可分性信息。也称为FDA:Fisher Discriminant Analysis
该算法的思想是:将 𝑐 个类别的样本集