数据挖掘笔记part one (认识数据挖掘)

ops/2024/10/8 23:38:51/

定义

从大量的,不完全的,有噪音的,模糊的,随机的数据中提取出存在潜在价值信息和知识的过程。

数据,信息,知识的关系

数据>信息>情报>知识>智慧(越小越精炼,越牛)

数据挖掘流程

数据--(筛选)--目标数据--(预处理)--已处理数据--(变换)--变换后数据--(数据挖掘)--模式

关联规则挖掘

通过样本数据来预测-------买面包后是否买牛奶的问题

分类和聚类

分类:有标签的学习(有对数据的明确定义,然后在对数据贴标签)

聚类:有学习的标签(先对数据进行学习,后面在判断并贴上标签)

eg:人的认识是从聚类到分类的过程


http://www.ppmy.cn/ops/122864.html

相关文章

Linux 命令基础

基础命令 通用格式 home目录 在根目录下面 ,家目录,Linux中会有多个用户使用,/home ls命令 直接输入ls 平铺显示当前工作目录下的内容 选项可以组合使用 -a all的意思,表示全部文件(包括隐藏…

介绍一款开源的 Modern GUI PySide6 / PyQt6的使用

首先附上大神的开源地址(自行克隆吧): https://github.com/Wanderson-Magalhaes/Modern_GUI_PyDracula_PySide6_or_PyQt6 步骤一:安装PySide6库 pip install PySide6 步骤二:运行main文件 python main.py 就得…

Telnet、SSH、RDP和VNC

Telnet、SSH、RDP和VNC都是远程访问和管理的协议或工具,它们各自具有不同的特点和适用场景。 一、基本概念与用途 Telnet 定义:一种基于命令行界面的远程管理协议,允许用户通过网络远程访问和管理计算机。用途:主要用于远程登录和…

职场中的人情世故,你懂了多少?

职场如战场,稍有不慎,满盘皆输。 职场如江湖,不是打打杀杀,而是人情世故。 成年人的世界里没有“容易”二字,我们也需要懂得哪些人情世故和。 职场上的各种光怪陆离现象,有很多职场人吐槽:“…

Golang 进阶4—— 网络编程

Golang 进阶4—— 网络编程 注意,该文档只适合有编程基础的同学,这里的go教程只给出有区别的知识点 网络编程: 把分布在不同地理区域的计算机与专门的外部设备用通信线路互连成一个规模大,功能强的网络系统,从而使众…

软件测试学习笔记

1、软件测试 软件:控制计算机硬件工作的工具 软件测试:使用技术手段验证软件是否满足使用需求 软件测试的目的:减少软件缺陷,保障软件质量 2、测试主流技术 功能测试 自动化测试 接口测试 性能测试 3、测试分类 按照测试…

gbase8s数据库实现黑白名单的几种方案

1、借用操作系统的黑白名单 2、使用数据库 TRUSTED CONTEXT 机制 CREATE TRUSTED CONTEXT tcx1USER rootATTRIBUTES (ADDRESS 172.16.39.162)ATTRIBUTES (ADDRESS 172.16.39.163)ENABLEWITH USE FOR wangyx WITHOUT AUTHENTICATION; 如上创建 可信任上下文对象 tcx1 在 jdb…

如何通过视觉分析检测车辆逆行行为

随着交通网络的快速扩展和车辆数量的持续增加,城市交通管理面临着前所未有的挑战。交通事故的多发原因之一是车辆逆行,这种行为不仅严重威胁其他车辆和行人的安全,也加重了交通拥堵问题。因此,如何有效监控并预防车辆逆行成为城市…