数据分析实战—玻璃类别分类

news/2024/12/21 23:45:02/

1.实战内容

(1) 加载玻璃类别数据集,划分训练集、测试集 

python">import pandas as pd
import numpy as np
pd.set_option('display.max_columns', None)
pd.set_option('display.max_rows', None)
# 读取数据集
glass = pd.read_csv('glass.csv', encoding='gbk', header=None)
glass_data = glass.iloc[1:, : -1]
glass_target = glass.iloc[1:, -1]
glass

python">glass_data

python">glass_target

python"># 划分训练集和测试集
from sklearn.model_selection import train_test_split
glass_data_train, glass_data_test, \
glass_target_train, glass_target_test = \
train_test_split(glass_data, glass_target, test_size=0.2, random_state=6)
python">glass_data_train
python">glass_data_test

(2) 对训练集、测试集进行标准差标准化,并分别输出标准化之后的训练集、测试集的方差和均值。 

python"># 标准差标准化
from sklearn.preprocessing import StandardScaler
stdScale = StandardScaler().fit(glass_data_train)
glass_trainScaler = stdScale.transform(glass_data_train)
glass_testScaler = stdScale.transform(glass_data_test)
print('标准差标准化后训练集数据的方差为:', np.var(glass_trainScaler))
print('标准差标准化后训练集数据的均值为:', np.mean(glass_trainScaler))
print('标准差标准化后测试集数据的方差为:', np.var(glass_testScaler))
print('标准差标准化后测试集数据的均值为:', np.mean(glass_testScaler))

python">glass_trainScaler

(3) 使用支持向量机对玻璃类别数据集进行分类,输出分类模型评价报告。

python"># PCA降维
from sklearn.decomposition import PCA
pca = PCA(n_components=0.999).fit(glass_data_train)
glass_trainPca = pca.transform(glass_data_train)
glass_testPca = pca.transform(glass_data_test)
python"># SVM分类模型
from sklearn.svm import SVC
svm = SVC().fit(glass_trainScaler, glass_target_train)
print('建立的SVM模型为:\n', svm)
glass_target_pred = svm.predict(glass_testScaler)
print('预测前10个结果为:\n', glass_target_pred[: 10])
# 打印出分类报告,评价分类模型性能
from sklearn.metrics import classification_report
print('使用SVM预测glass数据的分类报告为:', '\n',
classification_report(glass_target_test, glass_target_pred))

(4) 使用梯度提升回归树对玻璃类别数据集进行回归,并计算回归模型的5项评价指标得分。 

python">from sklearn.ensemble import GradientBoostingRegressor
GBR_glass = GradientBoostingRegressor().fit(glass_trainPca, glass_target_train)
glass_target_pred = GBR_glass.predict(glass_testPca)
# 回归模型评价指标
from sklearn.metrics import explained_variance_score, mean_absolute_error, mean_squared_error, median_absolute_error, r2_score
print('glass数据梯度提升回归树模型的平均绝对误差为:',
mean_absolute_error(glass_target_test, glass_target_pred))
print('glass数据梯度提升回归树模型的均方误差为:',
mean_squared_error(glass_target_test, glass_target_pred))
print('glass数据梯度提升回归树模型的中值绝对误差为:',
median_absolute_error(glass_target_test, glass_target_pred))
print('glass数据梯度提升回归树模型的可解释方差值为:',
explained_variance_score(glass_target_test, glass_target_pred))
print('glass数据梯度提升回归树模型的 R 方值为:',
r2_score(glass_target_test, glass_target_pred))

2.数据集下载

https://gitee.com/qxh200000/c_-code/commit/1af2468e6b7f1bd8cd3b890018031c6fa6dff9bd


http://www.ppmy.cn/news/1557049.html

相关文章

Vscode打开后闪退问题

vscode 动不动就无法启动呀? 表现为启动在任务管理器中一闪而过 我这边过一个周末就不行了,昨天重新安装,今天又启动不了了 解决方案: 在cmd中启动code.exe 报错提示: FATAL:v8_initializer.cc(630)] Error loadi…

【Super Tilemap Editor使用详解】(七):图块集纹理编辑器(Tileset Atlas Editor)

1、创建图块集后,我们可以打开 Atlas Editor Window(纹理编辑器窗口)以修改图块集的纹理和配置。 2、打开的方法 ,从菜单中选择 "SuperTilemapEditor/Window/Atlas Editor Window" 打开 3、图块集切片设置(S…

Pytorch | 从零构建AlexNet对CIFAR10进行分类

Pytorch | 从零构建AlexNet对CIFAR10进行分类 CIFAR10数据集AlexNet网络结构技术创新点性能表现影响和意义 AlexNet结构代码详解结构代码代码详解特征提取层 self.features分类部分self.classifier前向传播forward 训练过程和测试结果代码汇总alexnet.pytrain.pytest.py CIFAR1…

【网络安全】掌握 Active Directory 攻防审计实操知识点

掌握 Active Directory 攻防审计实操知识点 在深入了解 Active Directory 之前,我们需要先掌握网络基础设施的映射和资源访问管理方式。这一切通常通过目录服务 (Directory Services) 实现,目录服务在组织内提供网络资源的映射和访问。轻量目录访问协议…

python中的字典数据和标准json格式区别

Python中的字典(dict)数据和标准JSON(JavaScript Object Notation)格式在许多方面类似,因为JSON的对象结构本质上是键值对的集合。然而,它们之间仍存在一些重要的区别。以下是详细的对比: 1.数…

基于Java+SpringBoot+Vue摄影约拍管理系统(源码)

感谢您阅读本文,欢迎“一键三连”。作者定会不负众望,按时按量创作出更优质的内容。 ❤️ 1. 毕业设计专栏,毕业季咱们不慌,上千款毕业设计等你来选。 项目介绍: 摄影约拍管理系统是一款基于Java、Spring Boot、Vue技…

上海期货信息技术部分笔试题 - 解析

一、单选题 1.下列哪一种叙述是正确的(D) A.抽象方法的方法体部分必须用一对大括号{}包住 B.abstract修饰符可修饰字段、方法和类 C.声明抽象方法,大括号可有可无 D.声明抽象方法不可写出大括号 解析: 抽象方法没有方法体,因此不能有大…

Java全栈项目 - 学生档案管理系统

项目介绍 学生档案管理系统是一个基于 Spring Boot Vue.js 的全栈项目,主要用于管理学生的基本信息、学习记录、考勤情况等数据。系统采用前后端分离架构,具有良好的可扩展性和维护性。 技术栈 后端技术 Spring Boot 2.7.xSpring SecurityMyBatis P…