【数据挖掘】课程大纲

embedded/2024/10/18 14:24:08/

第1章 数据挖掘基础
   1.1 某知名连锁餐饮企业的困惑
   1.2 从餐饮服务到数据挖掘
   1.3 数据挖掘的基本任务
   1.4 数据挖掘建模过程
        1.4.1 定义挖掘目标
        1.4.2 数据取样
        1.4.3 数据探索
        1.4.4 数据预处理
        1.4.5 挖掘建模
        1.4.6 模型评价
   1.5 常用数据挖掘建模工具
   1.6 小结


第2章 R语言简介
    2.1 R安装
    2.2 R使用入门
         2.2.1 R操作界面
         2.2.2 RStudio窗口介绍
         2.2.3 R常用操作
    2.3 R数据分析包
    2.4 配套附件使用设置
    2.5 小结


第2.5章    数据管理
     1 变量的重命名 
     2 缺失值分析 
     3 数据排序 
     4 随机抽样 
     5 数值运算函数 
     6 字符串处理 
     7 文本分词 
     8 apply函数族 
     9 数据整合 
     10 控制流 
     11 函数的编写 
     12 小结 


第3章 数据探索
     3.1 数据质量分析
          3.1.1 缺失值分析

          3.1.2 异常值分析
          3.1.3 一致性分析
     3.2 数据特征分析
          3.2.1 分布分析
          3.2.2 对比分析
          3.2.3 统计量分析
          3.2.4 周期性分析
          3.2.5 贡献度分析
          3.2.6 相关性分析
     3.3 R语言主要数据探索函数
          3.3.1 统计特征函数
          3.3.2 统计作图函数
     3.4 小结


第4章 数据预处理
    4.1 数据清洗
        4.1.1 缺失值处理
        4.1.2 异常值处理
    4.2 数据集成
        4.2.1 实体识别
        4.2.2 冗余属性识别
    4.3 数据变换
        4.3.1 简单函数变换
        4.3.2 规范化
        4.3.3 连续属性离散化
        4.3.4 属性构造
        4.3.5 小波变换
    4.4 数据规约
        4.4.1 属性规约
        4.4.2 数值规约
    4.5 R语言主要数据预处理函数
    4.6 小结


第4.5章 图形探索 
4.1 图形元素 
    4.1.1 颜色 
    4.1.2 点 
    4.1.3 文本 
    4.1.4 线条 
    4.1.5 图例 
    4.1.6 坐标轴 
4.2 图形组合 
4.3 图形保存 
4.4 图形函数 
4.5 小结 
4.6 上机实验 


第5章 高级绘图工具 (扩展)
5.1 lattice包绘图工具 
    5.1.1 绘图特色 
    5.1.2 基本图形 
5.2 ggplot2包绘图工具 
    5.2.1 从qplot开始 
    5.2.2 ggplot作图 
5.3 交互式绘图工具简介 
    5.3.1 rCharts包 
    5.3.2 recharts包 
    5.3.3 googleVis包 
    5.3.4 htmlwidgets包 
    5.3.5 shiny包 
5.4 小结 


第5.5章 挖掘建模
5.1 分类与预测
    5.1.1 实现过程
    5.1.2 常用的分类与预测算法
    5.1.3 回归分析
    5.1.4 决策树
    5.1.5 人工神经网络
    5.1.6 分类与预测算法评价
    5.1.7 R语言主要分类与预测算法函数
5.2 聚类分析
     5.2.1 常用聚类分析算法
     5.2.2 KMeans聚类算法
     5.2.3 聚类分析算法评价
     5.2.4 R语言主要聚类分析算法函数
5.3 关联规则
     5.3.1 常用关联规则算法
     5.3.2 Apriori算法

5.4 时序模式
     5.4.1 时间序列算法
     5.4.2 时间序列的预处理
     5.4.3 平稳时间序列分析
     5.4.4 非平稳时间序列分析
     5.4.5 R语言主要时序模式算法函数
5.5 离群点检测
     5.5.1 离群点检测方法
     5.5.2 基于模型的离群点检测方法
     5.5.3 基于聚类的离群点检测方法
5.6 小结


http://www.ppmy.cn/embedded/3996.html

相关文章

Stable Diffusion 本地部署教程

截至我的最后更新(2023年),Stable Diffusion 是一个流行的开源深度学习模型,用于生成高质量的图像。由于它的强大功能和开放访问性,很多开发者和爱好者希望能够在本地环境中部署和使用它。以下是一个基本的本地部署教程…

深入kubernetes掌握核心概念--Service

深入解析service 一、概念二、什么是service?三、Service 的核心功能服务发现与负载均衡服务抽象多类型暴露健康检查与自动摘除DNS 解析 四、Service 类型五、Service 实现机制1.Service 实现主要依赖两个组件:2.Kubernetes 提供了多种负载均衡算法 六、Service 实…

Vanna-ai 大模型开源项目 基于RAG的TextToSql框架 安装和使用教程

github项目地址:vanna-ai/vanna: 🤖 与 SQL 数据库聊天📊。通过 LLMs使用RAG进行准确的TextToSQL的生成工作 🔄 。 Vanna 是 MIT 许可的开源 Python RAG(检索增强生成)框架,用于 SQL 生成和相关…

docker部署SpringCloud微服务项目

我们写好的项目,都需要部署上线,今天就给大家介绍一下,如何将微服务项目部署上线,一般我们部署项目都是先在本地docker部署一遍,如果没有问题再部署到服务器,那么今天我就按照这个顺序来说 前置条件 微服…

sqlilabs靶场1—20题学习笔记(思路+解析+方法)

前几个题目较为简单,均尝试使用各种方法进行SQL注入 第一题 联合查询 1)思路: 有回显值 1.判断有无注入点 2.猜解列名数量 3.判断回显点 4.利用注入点进行信息收集 爆用户权限,爆库,爆版本号 爆表,爆列&…

JAVA Stream流

Stream流 是Java 8引入的一种处理数据的强大工具,它提供了一种声明式、高效且易于并行化的编程模型,用于对集合、数组或其他数据源中的元素进行各种计算和操作。Stream API的核心思想是将数据作为一系列元素的序列(流)进行处理&a…

BOOT和UBOOT区别与联系

一、定义 1.1 Boot(启动) 在计算机和嵌入式系统的基本概念中,“boot”是指启动过程,这是一个系统从加电开始直至进入操作系统运行状态的过程。在嵌入式系统中,这个过程通常包括初始化硬件、加载并执行引导加载…

服务器数据恢复—xfs文件系统节点、目录项丢失的数据恢复案例

服务器数据恢复环境: EMC某型号存储,该存储内有一组由12块磁盘组建的raid5阵列,划分了两个lun。 服务器故障: 管理员为服务器重装操作系统后,发现服务器的磁盘分区发生改变,原来的sdc3分区丢失。由于该分区…