【数据挖掘】课程大纲

devtools/2024/11/14 20:12:02/

第1章 数据挖掘基础
   1.1 某知名连锁餐饮企业的困惑
   1.2 从餐饮服务到数据挖掘
   1.3 数据挖掘的基本任务
   1.4 数据挖掘建模过程
        1.4.1 定义挖掘目标
        1.4.2 数据取样
        1.4.3 数据探索
        1.4.4 数据预处理
        1.4.5 挖掘建模
        1.4.6 模型评价
   1.5 常用数据挖掘建模工具
   1.6 小结


第2章 R语言简介
    2.1 R安装
    2.2 R使用入门
         2.2.1 R操作界面
         2.2.2 RStudio窗口介绍
         2.2.3 R常用操作
    2.3 R数据分析包
    2.4 配套附件使用设置
    2.5 小结


第2.5章    数据管理
     1 变量的重命名 
     2 缺失值分析 
     3 数据排序 
     4 随机抽样 
     5 数值运算函数 
     6 字符串处理 
     7 文本分词 
     8 apply函数族 
     9 数据整合 
     10 控制流 
     11 函数的编写 
     12 小结 


第3章 数据探索
     3.1 数据质量分析
          3.1.1 缺失值分析

          3.1.2 异常值分析
          3.1.3 一致性分析
     3.2 数据特征分析
          3.2.1 分布分析
          3.2.2 对比分析
          3.2.3 统计量分析
          3.2.4 周期性分析
          3.2.5 贡献度分析
          3.2.6 相关性分析
     3.3 R语言主要数据探索函数
          3.3.1 统计特征函数
          3.3.2 统计作图函数
     3.4 小结


第4章 数据预处理
    4.1 数据清洗
        4.1.1 缺失值处理
        4.1.2 异常值处理
    4.2 数据集成
        4.2.1 实体识别
        4.2.2 冗余属性识别
    4.3 数据变换
        4.3.1 简单函数变换
        4.3.2 规范化
        4.3.3 连续属性离散化
        4.3.4 属性构造
        4.3.5 小波变换
    4.4 数据规约
        4.4.1 属性规约
        4.4.2 数值规约
    4.5 R语言主要数据预处理函数
    4.6 小结


第4.5章 图形探索 
4.1 图形元素 
    4.1.1 颜色 
    4.1.2 点 
    4.1.3 文本 
    4.1.4 线条 
    4.1.5 图例 
    4.1.6 坐标轴 
4.2 图形组合 
4.3 图形保存 
4.4 图形函数 
4.5 小结 
4.6 上机实验 


第5章 高级绘图工具 (扩展)
5.1 lattice包绘图工具 
    5.1.1 绘图特色 
    5.1.2 基本图形 
5.2 ggplot2包绘图工具 
    5.2.1 从qplot开始 
    5.2.2 ggplot作图 
5.3 交互式绘图工具简介 
    5.3.1 rCharts包 
    5.3.2 recharts包 
    5.3.3 googleVis包 
    5.3.4 htmlwidgets包 
    5.3.5 shiny包 
5.4 小结 


第5.5章 挖掘建模
5.1 分类与预测
    5.1.1 实现过程
    5.1.2 常用的分类与预测算法
    5.1.3 回归分析
    5.1.4 决策树
    5.1.5 人工神经网络
    5.1.6 分类与预测算法评价
    5.1.7 R语言主要分类与预测算法函数
5.2 聚类分析
     5.2.1 常用聚类分析算法
     5.2.2 KMeans聚类算法
     5.2.3 聚类分析算法评价
     5.2.4 R语言主要聚类分析算法函数
5.3 关联规则
     5.3.1 常用关联规则算法
     5.3.2 Apriori算法

5.4 时序模式
     5.4.1 时间序列算法
     5.4.2 时间序列的预处理
     5.4.3 平稳时间序列分析
     5.4.4 非平稳时间序列分析
     5.4.5 R语言主要时序模式算法函数
5.5 离群点检测
     5.5.1 离群点检测方法
     5.5.2 基于模型的离群点检测方法
     5.5.3 基于聚类的离群点检测方法
5.6 小结


http://www.ppmy.cn/devtools/4039.html

相关文章

STM32H7定时器TIM1-TIM17中断、PWM实现

STM32H7定时器TIM1-TIM17中断、PWM实现 高级定时器硬件框图定时器模式时基输出PWM定时器输入捕获 TIM1-TIM17的中断配置TIM1-TIM17的PWM输出 STM32H7 支持的定时器有点多,要简单的区分下。STM32H7 支持 TIM1-TIM8,TIM12-TIM17 共14 个定时器,…

【RV1106的ISP使用记录之基础知识】硬件连接关系与设备树的构建

RV1106具备2个mipi csi2 dphy硬件,1个VICAP硬件和1个ISP硬件。其中: 1、mipi csi2 dphy 用于对数据流的解析,支持MIPC,LVDS,DVP三种接口; 2、VICAP用于数据流的捕获; 3、ISP用于对图像数据进行处理; 这三个…

Java——二叉树

二叉树 二叉树在Java中是一种重要的数据结构,用于高效地组织和处理具有层级关系的数据。 二叉树的每个节点最多有两个子节点,这两个子节点分别称为左子节点和右子节点。这种结构非常适合于使用递归的方式进行定义和操作。在计算机科学中,二…

openlayers 入门教程(六):controls 篇

目录 一、常用的控件 二、使用控件方法 三、添加删除control 的基本方法 四、control示例 1 比例尺 - ScaleLine 2 鹰眼/缩小图 - OverviewMap 3 全屏 - FullScreen 4 版权信息 - Attribution 5 旋转地图 - Rotate 6 放大缩小 - Zoom 7 缩放滑块控件 - ZoomSlider …

C++:引用

C中的引用是一种别名,允许开发者在程序中使用已存在的变量名称来引用另一个变量。引用提供了一种简洁的方法来操作变量,而不需要复制数据本身。引用使用&符号声明,并在初始化时绑定到另一个变量。引用一旦初始化后,就不能再绑…

海外住宅IP如何助力国外问卷调查?

在数字化时代,国外问卷调查不仅是了解市场需求的重要手段,还成为了一项能够赚取额外收入的方式。随着全球范围内消费者行为的多样化,各类企业和机构越来越需要了解不同地区的用户观点和偏好,以优化产品和服务。 一、国外问卷调查…

C/C++ C/C++ 入门(6)模板初阶

个人主页:仍有未知等待探索-CSDN博客 专题分栏:C 多多指教! 一、泛型编程 在之前,我们进行编程的时候,总是针对于某一个具体的问题。就比如说,如何实现一个int类型的swap函数呢?大家肯定会写。…

关于新版本selenium定位元素报错:‘WebDriver‘ object has no attribute ‘find_element_by_id‘等问题

旧版本模式: # 以下inputTag任选其一,其他注释掉 inputTag driver.find_element_by_id("value") # 利用ID查找inputTags driver.find_element_by_class_name("value") # 利用类名查找inputTag driver.find_element_by_name(&q…