误闯机器学习(第一关-概念和流程)

embedded/2024/9/23 6:31:44/

以下内容,皆为原创,实属不易,请各位帅锅,镁铝点点赞赞关注吧!

好戏开场了。

一.什么是机器学习

        机器学习就是从数据中自动分析获取模型(总结出的数据),并训练模型,去预测数据

        内心独白:就好比我们人从日常生活中,归纳总结得出经验。利用总结的经验去得出最佳策略。 举个例子:机器从数据(大量的猫狗图片)中自动分析得到模型(辨别猫狗的规律),从而使得猫狗拥有辨别猫狗的能力。懂??比如这就是一个猫。哈哈哈。
        

二.数据集构成 

        结构:特征值+目标值(一般最后一列就是目标值)

        注:每一行数据作为样本。        有些数据集可以没有目标值。

三.机器学习算法分类

        我这里是按照目标值的不同分的,简单看看就行,下面我仔细给大家分类一下。

               监督学习(有目标值,预测):

                        目标值:类别(是猫还是狗)-----分类问题

                        目标值:预测连续型的数据--------回归问题(线性回归等等)

                目标值:无-----------------------------无监督学习

  • 监督学习
    • 定义:输入数据是有特征值和目标值组成。函数的输出可以是一个连续的值(成为回归)。或者是输出是有限个离散值(成为分类)
    • 分类:k-紧邻算法,贝叶斯分类,决策树和随机森林,逻辑回归
    • 回归:线性回归,岭回归
  • 无监督学习
    • 定义:输入数据是由输入特征值组成
    • 聚类:k-means

四.机器学习开发流程

  1. 获取数据(有数据你才能得到模型啊)
  2. 数据预处理(把那些无用的数据删掉,比如:空值,无意义的,乱码)
  3. 特征工程(对特征值进行处理)
  4. 机器学习算法训练--模型
  5. 模型评估(如果模型不行的话,从第二步开始重新看看,再优化一下,直到模型评估良好)
  6. 应用(模型好了,我们才能应用)       

内心独白:很简单啊,机器学习不就是从数据中自动分析获取模型并预测数据嘛,一句话的事。机器学习开发的流程也还可以吧~~。首先,你肯定要有数据,对数据进行预处理,然后训练模型,模型评估。如果评估差了,就重新从数据预处理看看,还有哪些还可以优化的地方。


http://www.ppmy.cn/embedded/98509.html

相关文章

Vscode——如何实现 Ctrl+鼠标左键 跳转函数内部的方法

一、对于Python代码 安装python插件即可实现 二、对于C/C代码 安装C/C插件即可实现

SpringIoCDI

前言👀~ 上一章我们介绍了Spring MVC,今天介绍Spring核心功能之一IoC Spring到底是什么? Spring IoC 什么是 IoC 容器? IoC 介绍 DI 介绍 IoC详解 获取Bean对象的其他方式 Bean的存储 方法注解 Bean 扫描路径 DI详解 …

代码复现改进

代码复现,文献复现,文章复现, 算法复现,科研复现 Matlab,Python中英文均可 保证质量,加快你的研究速度 代码改进跑通,模型优化改进

Processing练习之鼠标控制线段粗细

案例代码如下: import processing.pdf.*; import java.util.Calendar; boolean savePDF false; int tileCount 20; int actRandomSeed 0; int actStrokeCap ROUND; void setup(){ size(600,600); } void draw(){ if(savePDF)beginRecord(PDF, timestamp()"…

微前端架构下的单页应用实现策略

随着Web应用的复杂性日益增加,传统的多页应用(MPA)模式已经难以满足现代Web开发的需求。单页应用(SPA)以其流畅的用户体验和高效的页面加载速度,逐渐成为Web开发的主流模式。然而,在微前端架构下…

【C++】OJ习题(初阶)

🚀个人主页:奋斗的小羊 🚀所属专栏:C 很荣幸您能阅读我的文章,诚请评论指点,欢迎欢迎 ~ 目录 💥1、字符串💥1.1 字符串相加💥1.2 验证回文字符串💥1.3 反转…

OceanMind海睿思入选《2024中国企业数智化转型升级服务全景图/产业图谱》

近日,国内知名数据智能产业创新服务媒体数据猿携手上海大数据联盟发布了《2024中国企业数智化转型升级服务全景图/产业图谱1.0版》。中新赛克海睿思从数千家企业中脱颖而出,成功入选「底层技术服务 - 大数据」细分领域。 在历经数月的时间里,…

CPMF复现笔记(2):训练MVTecAD-3D数据集, 精度SOTA

文章来自曹云康的最新论文《Complementary Pseudo Multimodal Feature for Point Cloud Anomaly Detection》,在MVTecAD-3D取得了最佳分数。代码地址GitHub - caoyunkang/CPMF: [PR] Complementary Pseudo Multimodal Feature for Point Cloud Anomaly Detection 复现效果 …