机器学习—赵卫东阅读笔记(一)

embedded/2025/3/6 6:52:54/

第一章:机器学习基础

1.1.2 机器学习主要流派

1.符号主义

2.贝叶斯分类——基础是贝叶斯定理

3.联结主义——源于神经学,主要算法是神经网络。——BP算法:作为一种监督学习算法,训练神经网络时通过不断反馈当前网络计算结果与训练数据之间的误差来修正网络权重,使误差足够小。

4.进化计算——通过迭代优化,找到最佳结果。——具有自组织、自适应、自学习的特性,能够有效处理传统优化算法难以解决的复杂问题(例如NP困难优化问题)。

5.行为主义——强化学习

1.2. 机器学习、人工只能和数据挖掘

1.2.2 什么是数据挖掘

1.异常检测:对不符合预期模式的样本、事件进行识别。

2.关联规则学习:在数据库中发现变量之间的关系

3.聚类:聚类是一种探索性分析,在未知数据结构的情况下,根据相似性把样本分为不同的簇或子集,不同簇的样本具有很大的差异性,从而发现数据的类别与结构。

4.分类:根据已知样本的某些特征,判断一个新样本属于哪种类别。

5.回归:回归是一种统计分析法,用于了解两个或多个变量之间的相关关系。回归的目标是找出误差最小的拟合函数作为模型,用特定的自变量来预测因变量的值。

1.3 机器学习应用的典型领域

1.图像处理

2.金融

3.医疗

4.自然语言处理

5.网络安全

6.工业

7.娱乐业

1.4 机器学习算法

(1)有监督学习——从有标记的训练种学习一个模型,然后根据这个模型对未知样本进行预测。

有监督学习包括分类和数字预测两大类别,前者包括逻辑回归、决策树、KNN、随机森林、支持向量机、朴素贝叶斯等。后者包括线性回归、KNN、梯度提升和自适应提升等

(2)无监督学习——输入样本不需要标记,而是自动从样本中学习特征实现预测。常见的无监督学习算法有聚类和关联分析等,在人工神经网络中,自组织映像和适应谐振理论是最常用的无监督学习。

(3)强化学习——通过观察来学习做什么样的动作。

1.分类算法——是应用分类规则对记录进行目标映射,将其划分到不同的分类中,构建具有泛能力的算法模型,即构建映射规则来预测未知样本的类别。

       分类算法包括预测和描述两种,经过训练集学习的预测模型在遇到未知记录,应用规则对其进行类别划分,而描述型的分类主要对现有数据集中特征进行解释并进行区分。

       主要的分类算法包括决策树、支持向量机、KNN、贝叶斯网络和神经网络等。

  1. 决策树:决策树是一颗用于决策的树,目标类别作为叶结点,特征属性的验证作为非叶节点,而每个分支是特征属性的输出结果。 决策树的构建过程是按照属性的优先级或重要性来逐渐确定树的层次结构,使叶节点尽可能属于同一类别,一般采用局部最优的贪心策略来构建决策树。
  2. SVM:其主要思想是将低维特征空间中的线性不可分进行非线性映射,转化为高位空间的线性可分。
  3. KNN:对样本应用向量空间模型表示,将相似高的样本分为一类,对新样本计算与之距离最近(最相似)的样本的类别。
  4. 贝叶斯网络:基于贝叶斯定理绘制的具有概率分布的有向弧段图形化网络,其理论基础是贝叶斯公式,网络中的每个点表示变量,有向弧段表示两者间的概率关系。
  5. 神经网络:包括输入层、隐藏层、输出层,每一个节点代表一个神经元,节点之间的连线对应权重,输入变量经过神经元时会运行激活函数,对输入值赋予权重并加上偏置,将输出结果传递到下一层中的神经元,而权重和偏置在神经网络训练过程中不断修正。

2.聚类算法

聚类是基于无监督学习的分析模型。

聚类方法可分为基于层次的模型、基于划分的聚类、基于密度的聚类、基于约束的聚类、基于网络的聚类等。


http://www.ppmy.cn/embedded/170420.html

相关文章

物联网感应层设备的通信协议及数据上传路径详解

以下是物联网感应层设备的通信协议及数据上传路径详解&#xff0c;包含典型技术方案和实际应用案例&#xff1a; 一、通信协议矩阵 短距离传输&#xff08;<100m&#xff09; 协议类型技术特性典型设备应用场景BLE 5.22Mbps速率&#xff0c;mesh组网可穿戴设备医疗手环连接…

剑指 Offer II 059. 数据流的第 K 大数值

comments: true edit_url: https://github.com/doocs/leetcode/edit/main/lcof2/%E5%89%91%E6%8C%87%20Offer%20II%20059.%20%E6%95%B0%E6%8D%AE%E6%B5%81%E7%9A%84%E7%AC%AC%20K%20%E5%A4%A7%E6%95%B0%E5%80%BC/README.md 剑指 Offer II 059. 数据流的第 K 大数值 题目描述 设…

JavaWeb XML

1、定义 EXtension markup language XML&#xff1a;可扩展自定义标记语言 2、XML的存在意义和用法 XML存在约束&#xff0c;可以自定义但也存在书写规则&#xff0c;一般不需要逐行书写。 我们使用XML&#xff0c;只需要基于第三方应用程序和已提供框架的配置文件进行修改…

SpringBoot项目集成ElasticSearch

1. 项目背景 处于失业找工作的阶段&#xff0c;随便写写吧~ 没啥背景&#xff0c;没啥意义&#xff0c;Java后端越来越卷了。第一学历不是本科&#xff0c;感觉真的是没有一点路可走。 如果有路过的小伙伴&#xff0c;如果身边还有坑位&#xff0c;不限第一学历的话&#xff0…

leetcode每日一题——1328. 破坏回文串

给你一个由小写英文字母组成的回文字符串 palindrome &#xff0c;请你将其中 一个 字符用任意小写英文字母替换&#xff0c;使得结果字符串的 字典序最小 &#xff0c;且 不是 回文串。 请你返回结果字符串。如果无法做到&#xff0c;则返回一个 空串 。 如果两个字符串长度…

leetcode1 两数之和 哈希表

什么时候使用哈希法&#xff0c;当我们需要查询一个元素是否出现过&#xff0c;或者一个元素是否在集合里的时候&#xff0c;就要第一时间想到哈希法。 242. 有效的字母异位词 (opens new window)这道题目是用数组作为哈希表来解决哈希问题&#xff0c;349. 两个数组的交集 (o…

Docker 学习(一)

一、Docker 核心概念 Docker 是一个开源的容器化平台&#xff0c;允许开发者将应用及其所有依赖&#xff08;代码、运行时、系统工具、库等&#xff09;打包成一个轻量级、可移植的“容器”&#xff0c;实现 “一次构建&#xff0c;随处运行”。 1、容器&#xff08;Container…

SpringBoot为什么要禁止循环依赖?

大家好&#xff0c;我是锋哥。今天分享关于【SpringBoot为什么要禁止循环依赖?】面试题。希望对大家有帮助&#xff1b; SpringBoot为什么要禁止循环依赖? 1000道 互联网大厂Java工程师 精选面试题-Java资源分享网 Spring Boot 和 Spring 框架之所以要避免循环依赖&#xf…