数据分析-49-时间序列信息编码之采用虚拟变量

embedded/2024/11/22 23:18:36/

文章目录

  • 1 基本概念
    • 1.1 虚拟变量(one-hot)
    • 1.2 时间特征
  • 2 模拟数据
    • 2.1 日期序列
    • 2.2 目标序列
  • 3 编码虚拟变量(one-hot)
    • 3.1 年份编码
    • 3.2 月份编码
    • 3.3 星期几编码
  • 4 拟合模型
    • 4.1 构建数据集(每月编码)
    • 4.2 构建数据集(每日编码)
  • 5 参考附录

1 基本概念

1.1 虚拟变量(one-hot)

虚拟变量(dummy variable)也叫哑变量,翻译不同而已。因为dummy的含义有假的、虚拟的、哑的等各种含义,所以国内翻译也不一样,但是他们俩是一回事。

虚拟变量其实算不上一种变量类型(比如连续变量、分类变量等),确切地说,是一种将多分类变量转换为二分变量的一种形式。Dummy这个词意思是虚拟的、假的,所以dummy variable意思就是假的变量,不是真实的变量。

如果使用定性数据或分类数据,通常需要引入虚拟变量,即取值为0或1的变量,如性别变量。哑变量或虚拟变量,是人为设定的用于将分类变量引入回归模型中的方法。

在回归分析中,自变量X既可以是定量数据也可以定类数据。回归分析计算时是将所有自变量X视为数字,但当数据为定类数据时,此时数字代表类别,数字大小本身没有比较意义。因此,这类数据在做回归分析时,需要设置成哑变量才能纳入回归分析正确分析数据。

通常情况下,回归分析,逐步回归,分层回归,Logistic回归,PLS回归等这类影响关系研究的方法时,才可能涉及到虚拟变量设置。

用一个例子说明:研究性别和工龄对


http://www.ppmy.cn/embedded/139732.html

相关文章

项目上线之后,出现过线上问题吗?怎么排查和解决的?

在面试中,相信大家都遇到过这个问题。 本文将通过训练营内部抽奖项目的问题案例——抽奖结果通知延迟和抽奖列表加载缓慢,讲清楚它们的解决方法和优化策略。 回答思路 这些问题都是在我负责的项目中出现过的,给我留下了深刻的印象。 一、…

大数据-230 离线数仓 - ODS层的构建 Hive处理 UDF 与 SerDe 处理 与 当前总结

点一下关注吧!!!非常感谢!!持续更新!!! Java篇开始了! 目前开始更新 MyBatis,一起深入浅出! 目前已经更新到了: Hadoop&#xff0…

药方新解:Spring Boot中药实验管理系统设计

3系统分析 3.1可行性分析 通过对本中药实验管理系统实行的目的初步调查和分析,提出可行性方案并对其一一进行论证。我们在这里主要从技术可行性、经济可行性、操作可行性等方面进行分析。 3.1.1技术可行性 本中药实验管理系统采用SSM框架,JAVA作为开发语…

Swift内存访问冲突

内存的访问,发生在给变量赋值的时候,或者传递值(给函数)的时候,例如 var one 1//向one的内存区域发起一次写的操作 print("\(one)")//向one的内存区域发起一次读的操作 在 Swift 里,有很多修改…

pycharm复现github项目代码问题记录

目录 1.anaconda下载问题2.创建项目虚拟环境---在Anaconda Prompt中或在pycharm终端里3.conda安装与卸载4.镜像源附录 1.anaconda下载问题 按照教程下载后,配置的环境全部保存在了C盘,导致C盘爆满: 按照如下进行修改,将环境地址放…

多目标优化算法:多目标蛇鹫优化算法(MOSBOA)求解ZDT1、ZDT2、ZDT3、ZDT4、ZDT6,提供完整MATLAB代码

一、蛇鹫优化算法 蛇鹫优化算法(Secretary Bird Optimization Algorithm,简称SBOA)由Youfa Fu等人于2024年4月发表在《Artificial Intelligence Review》期刊上的一种新型的元启发式算法。该算法旨在解决复杂工程优化问题,特别是…

跨平台编译Go程序:GOOS和GOARCH环境变量的使用

在Go语言开发中,我们经常需要为不同的操作系统和处理器架构编译程序。Go语言提供了两个环境变量GOOS和GOARCH,允许我们轻松地为不同的目标平台编译代码。本文将介绍如何使用这两个环境变量来编译适用于不同平台和架构的Go程序。 1. 理解GOOS和GOARCH G…

Spring Boot汽车资讯:速度与信息的融合

3系统分析 3.1可行性分析 通过对本汽车资讯网站实行的目的初步调查和分析,提出可行性方案并对其一一进行论证。我们在这里主要从技术可行性、经济可行性、操作可行性等方面进行分析。 3.1.1技术可行性 本汽车资讯网站采用SSM框架,JAVA作为开发语言&#…