一、人工智能学习算法分类
人工智能算法大体上来说可以分类两类:基于统计的机器学习算法(Machine Learning)和深度学习算法(Deep Learning)
总的来说,在sklearn中机器学习算法大概的分类如下:
- 纯算法类
(1).回归算法
(2).分类算法
(3).聚类算法
(4)降维算法
(5)概率图模型算法
(6)文本挖掘算法
(7)优化算法
(8)深度学习算法
2.建模方面
(1)模型优化
(2)数据预处理
二、详细算法
1.分类算法
(1).LR (Logistic Regression,逻辑回归又叫逻辑分类)
(2).SVM (Support Vector Machine,支持向量机)
(3).NB (Naive Bayes,朴素贝叶斯)
(4).DT (Decision Tree,决策树)
1).C4.5
2).ID3
3).CART
(5).集成算法
1).Bagging
2).Random Forest (随机森林)
3).GB(梯度提升,Gradient boosting)
4).GBDT (Gradient Boosting Decision Tree)
5).AdaBoost
6).Xgboost
(6).最大熵模型
2.回归算法
(1).LR (Linear Regression,线性回归)
(2).SVR (支持向量机回归)
(3). RR (Ridge Regression,岭回归)
3.聚类算法
(1).Knn
(2).Kmeans 算法
(3).层次聚类
(4).密度聚类
4.降维算法
(1).SGD (随机梯度下降)
5.概率图模型算法
(1).贝叶斯网络
(2).HMM
(3).CRF (条件随机场)
6.文本挖掘算法
(1).模型
1).LDA (主题生成模型,Latent Dirichlet Allocation)
2).最大熵模型
(2).关键词提取
1).tf-idf
2).bm25
3).textrank
4).pagerank
5).左右熵 :左右熵高的作为关键词
6).互信息:
(3).词法分析
1).分词
– ①HMM (因马尔科夫)
– ②CRF (条件随机场)
2).词性标注
3).命名实体识别
(4).句法分析
1).句法结构分析
2).依存句法分析
(5).文本向量化
1).tf-idf2).word2vec3).doc2vec4).cw2vec
(6).距离计算
1).欧氏距离
2).相似度计算
7.优化算法
(1).正则化
1).L1正则化
2).L2正则化
8.深度学习算法
(1).BP
(2).CNN
(3).DNN
(3).RNN
(4).LSTM
三、建模方面
1.模型优化·
(1).特征选择
(2).梯度下降
(3).交叉验证
(4).参数调优
(5).模型评估:准确率、召回率、F1、AUC、ROC、损失函数
2.数据预处理
(1).标准化
(2).异常值处理
(3).二值化
(4).缺失值填充: 支持均值、中位数、特定值补差、多重插补
————————————————
版权声明:本文为CSDN博主「白玉杰」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/qq_40535327/article/details/104721361