基于Scikit-learn的多元线性回归模型构建与验证

embedded/2024/11/13 16:19:18/

废话不多说,直接上代码

# import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error
import joblib  # 用于保存和加载模型# 1. 导入数据(假设你有一个包含特征和目标值的CSV文件)
# 例如,data.csv 中有若干特征列和一个名为 'target' 的目标列
data = pd.read_csv('FuelConsumptionCo21.csv')# 2. 准备数据
# 分离特征和目标值
X = data.drop('target', axis=1)
y = data['target']# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)# 3. 创建并训练模型
model = LinearRegression()
model.fit(X_train, y_train)print(model.coef_)
print(model.intercept_)# 4. 进行预测并评估模型
y_pred = model.predict(X_test)
mse = mean_squared_error(y_test, y_pred)
print(f'Mean Squared Error: {mse}')# 5. 保存模型
joblib.dump(model, 'linear_regression_model.pkl')# 6. 加载模型(可选,验证模型是否正确保存和加载)
loaded_model = joblib.load('linear_regression_model.pkl')
loaded_y_pred = loaded_model.predict(X_test)
loaded_mse = mean_squared_error(y_test, loaded_y_pred)
print(f'Mean Squared Error after loading: {loaded_mse}')

原始数据是汽车 二氧化碳污染指标排放,数据如下

ENGINESIZECYLINDERSFUELCONSUMPTION_CITYFUELCONSUMPTION_HWYFUELCONSUMPTION_COMBFUELCONSUMPTION_COMB_MPGtarget
249.96.78.533196
2.4411.27.79.629221
1.5465.85.948136
3.5612.79.111.125255
3.5612.18.710.627244
3.5611.97.71028230
3.5611.88.110.128232
3.7612.8911.125255
3.7613.49.511.624267
2.4410.67.59.231212
2.4411.28.19.829225
3.5612.18.310.427239
5.9121812.615.618359
5.9121812.615.618359
4.7817.411.314.719338
4.7818.112.215.418354
4.7817.411.314.719338
4.7818.112.215.418354
5.9121812.615.618359
249.97.48.832202
2411.58.11028230
2410.87.59.330214

http://www.ppmy.cn/embedded/136954.html

相关文章

计算机课程管理:Spring Boot与工程认证的协同创新

3系统分析 3.1可行性分析 通过对本基于工程教育认证的计算机课程管理平台实行的目的初步调查和分析,提出可行性方案并对其一一进行论证。我们在这里主要从技术可行性、经济可行性、操作可行性等方面进行分析。 3.1.1技术可行性 本基于工程教育认证的计算机课程管理平…

前端笔试中oj算法题的解法模版

如今计算机行业的校招大多都是需要先进行笔试,之后才有面试,如果发现题目都会但是却因为自己不了解接受输入参数的模板导致没能通过笔试,哪还是比较可惜的(我就碰到过这种问题pwq)。因此我特意上网查了一下&#xff0c…

C 语言学习-05【数组】

1、一维数组元素的操作 输入一个数&#xff0c;按原来排序的规律将它插入到一个一排列好的数组中&#xff1a; #include <stdio.h>int main() {int i, data, a[10] {2, 3, 6, 9, 11, 12, 14, 17, 19};printf("Primitive series: \n");for (i 0; i < 9; i)…

详细分析Guava库中的注解@VisibleForTesting,用于标记提醒私有(附Demo)

目录 前言1. 基本知识2. Demo 前言 对于Java基本知识推荐阅读&#xff1a; java框架 零基础从入门到精通的学习路线 附开源项目面经等&#xff08;超全&#xff09;【Java项目】实战CRUD的功能整理&#xff08;持续更新&#xff09; 从实战中学习&#xff1a; 源码如下&…

【韩老师零基础30天学会Java 】06章 数组、排序和查找

第六章 数组、排序和查找 1. 数组&#x1f6a9;&#x1f6a9; 数组介绍&#xff1a; 数组可以存放多个同一类型的数据。数组也是一种数据类型&#xff0c;是引用类型。即:数组就是一组数据。 示例&#xff1a; double [] hens{3,5,1,3,4,2,50,7.8,88.8,1.1,5}; double totalWe…

ENSP作业——园区网

题目 根据上图&#xff0c;可得需求为&#xff1a; 1.配置交换机上的VLAN及IP地址。 2.设置SW1为VLAN 2/3的主根桥&#xff0c;设置SW2为VLAN 20/30的主根桥&#xff0c;且两台交换机互为主备。 3.可以使用super vlan。&#xff08;本次实验中未使用&#xff09; 4.上层通过静…

基于开源AI智能名片2+1链动模式S2B2C商城小程序源码的连环消费链条优化研究

摘要&#xff1a;随着电子商务的快速发展&#xff0c;如何提高顾客的复购率成为了商家关注的焦点。本文通过对开源AI智能名片21链动模式S2B2C商城小程序源码的研究&#xff0c;探讨了如何利用自动化促销模式构建连环消费链条&#xff0c;从而不断刺激顾客复购。本文首先介绍了连…

【大数据学习 | HBASE高级】region split机制和策略

1. region split机制 ​ HRegionServer拆分region的步骤是&#xff0c;先将该region下线&#xff0c;然后拆分&#xff0c;将其子region加入到hbase:meta表中&#xff0c;再将他们加入到原本的HRegionServer中&#xff0c;最后汇报Master。 split前&#xff1a;hbase:meta表有…