实训1:拉格朗日法插补用户用电量数据缺失值

news/2024/11/19 7:31:44/

实训1:拉格朗日法插补用户用电量数据缺失值

实训任务:

  1. 读取missing_data.csv表
  2. 查询缺失值位置
    3.使用SciPy库中的interpolate模块下的lagrange对数据进行拉格朗日插值
  3. 使用数据查看是否存在缺失值,不存在则说明插值成功

查询缺失值位置

isnull=[]for i in df.columns:for j in df.index:if df.isnull().loc[j,i]:isnull.append((j,i))
isnull

输出结果:

[(5, 'A'),(12, 'A'),(3, 'B'),(10, 'B'),(19, 'B'),(20, 'B'),(4, 'C'),(7, 'C'),(10, 'C'),(16, 'C')]

拉格朗日插值

 #传入存在缺失值的列,缺失值所在0轴坐标index,按前后k个数来计算拉格朗日插值,返回index的拉格朗日插值
def LagFill(df,i,k):r=0 if (i-k)<0 else (i-k) #python的三目运算符较为特殊l=len(df.index) if (i+1+k)>len(df.index) else (i+1+k)y=df.loc[list(range(r,i))+list(range(i+1,l))] #取index前后k个数据作为y代入拉格朗日函数进行拟合for j in y.index:if y.isnull().loc[j]:y.drop(index=j,inplace=True)x=y.indexlag=lagrange(x.values,y.values)return lag(i)

调用自定义插值函数

for i in isnull:fnum=LagFill(df.loc[:,i[1]],i[0],5)df.loc[i[0],i[1]]=fnum

这样df的缺失值就全部被插补了!


http://www.ppmy.cn/news/651079.html

相关文章

大工业用电计费及其相关知识

电费计算方法主要分为大工业用电和一般工商业用电、农业生产用电用电、居民生活用电。 1、概念 大工业用电指受电变压器&#xff08;含不通过受电变压器的高压电动机&#xff09;容量在315千伏安及以上的下列用电&#xff1a; &#xff08;1&#xff09;以电为原动力&#xf…

时间序列预测:用电量预测 02 KNN(K邻近算法)

&#x1f32e;开发平台&#xff1a;jupyter lab &#x1f356;运行环境&#xff1a;python3、TensorFlow2.x ----------------------------------------------- 2022.9.16 测验成功 ---------------------------------------------------------------- 1. 时间序列预测&#x…

线性回归入门案例 家庭用电量预测

本博客是线性回归的入门案例&#xff0c;仅用到一阶线性回归 代码中用到的数据集下载地址 [link] https://pan.baidu.com/s/12wSIOVMQ3zS3jK0FcwkTSw[ python3版本代码段 导包 #导包 import numpy as np import matplotlib.pyplot as plt import pandas as pd import time…

时间序列预测11:用电量预测 01 数据分析与建模

【时间序列预测/分类】 全系列60篇由浅入深的博文汇总&#xff1a;传送门 写在前面 通过之前有关LSTM的8遍基础教程和10篇处理时间序列预测任务的教程介绍&#xff0c;使用简单的序列数据示例&#xff0c;已经把LSTM的原理&#xff0c;数据处理流程&#xff0c;模型架构&#…

python用支持向量机回归(SVR)模型分析用电量预测电力消费

最近我们被客户要求撰写关于支持向量机回归的研究报告&#xff0c;包括一些图形和统计输出。 本文描述了训练支持向量回归模型的过程&#xff0c;该模型用于预测基于几个天气变量、一天中的某个小时、以及这一天是周末/假日/在家工作日还是普通工作日的用电量。 【视频】支持向…

算力网络:十大技术发展方向

摘自&#xff1a;https://mp.weixin.qq.com/s/yykVHtdUVGL7G9E1jtMIxg 在社会算力并网场景下&#xff0c;将联合超算、智算等社会算力开展算力并网验证&#xff1b;在云边端协同场景下&#xff0c;打造算网融合创新技术方案&#xff0c;探索算网大脑雏形&#xff0c;深入车联网…

全国281个地级市工业用电量数据(2003-2016)

数据集名称&#xff1a;全国281个地级市工业用电量数据 时间范围&#xff1a;2003-2016年 数据来源&#xff1a;EPS数据库 相关说明&#xff1a;工业用电大多使用三相电压&#xff0c;如三相380VAC&#xff0c;三相660VAC等。 工业用电与居民用电的区别&#xff1a;工业用电…

时间序列预测:用电量预测 05 BP神经网络

&#x1f32e;开发平台&#xff1a;jupyter lab &#x1f356;运行环境&#xff1a;python3、TensorFlow2.x ----------------------------------------------- 2022.9.16 测验成功 ---------------------------------------------------------------- 1. 时间序列预测&#x…