人工智能知识分享第八天-机器学习_泰坦尼克生存预估线性回归和决策树回归对比案例

server/2025/1/8 19:27:22/

泰坦尼克生存预估案例

import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import classification_report
import matplotlib.pyplot as plt
from sklearn.tree import plot_treetitanic_df = pd.read_csv('./data/train.csv')
titanic_df.info()x = titanic_df[['Pclass', 'Sex', 'Age']]
y = titanic_df['Survived']# x['Age'].fillna(x['Age'].mean(), inplace=True)
x['Age'] = x['Age'].fillna(x['Age'].mean())
x.info()print(len(x), len(y))
# titanic_df.info()x = pd.get_dummies(x)
x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.2, random_state=22)estimator = DecisionTreeClassifier()
estimator.fit(x_train, y_train)y_predict = estimator.predict(x_test)print('预测结果为:\n', y_predict)
print('准确率: \n', estimator.score(x_test, y_test))
print(f'分类评估报告: \n {classification_report(y_test, y_predict, target_names=["Died", "Survivor"])}')
plt.figure(figsize=(70, 45))
plot_tree(estimator, filled=True, max_depth=10)
plt.savefig("./data/titanic_tree.png")
# 7.3 具体的绘制.
plt.show()

运行结果
在这里插入图片描述

在这里插入图片描述

线性回归和决策树回归对比案例

"""
案例:演示线性回归回归决策树对比.结论:回归类问题, 既能用线性回归, 也能用决策树回归. 优先使用 线性回归, 因为 决策树回归可能会导致 过拟合.
"""# 导包.
import numpy as np
import pandas as pd
from sklearn.tree import DecisionTreeRegressor      # 回归决策树
from sklearn.linear_model import LinearRegression   # 线性回归
import matplotlib.pyplot as plt                     # 绘图# 1. 获取数据.
x = np.array(list(range(1,11))).reshape(-1, 1)
y = np.array([5.56, 5.70, 5.91, 6.40, 6.80, 7.05, 8.90, 8.70, 9.00, 9.05])
print(x)
print(y)# 2. 创建线性回归 和 决策树回归模型.
estimator1 = LinearRegression()                    # 线性回归
estimator2 = DecisionTreeRegressor(max_depth=1)    # 回归决策树, 层数=1
estimator3 = DecisionTreeRegressor(max_depth=3)    # 回归决策树, 层数=3# 3. 训练模型.
estimator1.fit(x, y)
estimator2.fit(x, y)
estimator3.fit(x, y)# 4. 准备测试数据, 用于测试.
# 起始, 结束, 步长.
x_test = np.arange(0.0, 10.0, 0.1).reshape(-1, 1)
print(x_test)# 5. 模型预测.
y_predict1 = estimator1.predict(x_test)
y_predict2 = estimator2.predict(x_test)
y_predict3 = estimator3.predict(x_test)# 6. 绘图
plt.figure(figsize=(10, 5))# 散点图(原始的坐标)
plt.scatter(x, y, color='gray', label='data')
# 线性回归的预测结果
plt.plot(x_test, y_predict1, color='r', label='liner regression')
# 回归决策树, 层数=1
plt.plot(x_test, y_predict2, color='b', label='max depth=1')
# 回归决策树, 层数=3
plt.plot(x_test, y_predict3, color='g', label='max depth=3')
# 显示图例.
plt.legend()
# 设置x轴标签.
plt.xlabel('data')
# 设置y轴标签.
plt.ylabel('target')
# 设置标题
plt.title('Decision Tree Regression')# 显示图片
plt.show()

运行结果
在这里插入图片描述
坚持分享 共同进步


http://www.ppmy.cn/server/156125.html

相关文章

每天40分玩转Django:Django Celery

Django Celery 一、知识要点概览表 模块知识点掌握程度要求Celery基础配置、任务定义、任务执行深入理解异步任务任务状态、结果存储、错误处理熟练应用周期任务定时任务、Crontab、任务调度熟练应用监控管理Flower、任务监控、性能优化理解应用 二、基础配置实现 1. 安装和…

深入Android架构(从线程到AIDL)_09 认识Android的主线程

目录 UI线程的诞生 練習: 绑定(Bind)远程的Service UI线程的诞生 当我们启动某一支AP时, Android就会诞生新进程(Process),并且将该AP程序加载这新诞生的进程里。每个进程在其诞生时刻,都会诞生一个主线程,又称为UI…

芯片引脚缺陷检测数据集VOC+YOLO格式203张2类别

数据集格式:Pascal VOC格式YOLO格式(不包含分割路径的txt文件,仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件) 图片数量(jpg文件个数):203 标注数量(xml文件个数):203 标注数量(txt文件个数):203 标注…

STM32 软件I2C读写

单片机学习! 目录 前言 一、软件I2C读写代码框架 二、I2C初始化 三、六个时序基本单元 3.1 引脚操作的封装和改名 3.2 起始条件执行逻辑 3.3 终止条件执行逻辑 3.4 发送一个字节 3.5 接收一个字节 3.5 发送应答&接收应答 3.5.1 发送应答 3.5.2 接…

Tesseract5.4.0自定义LSTM训练

准备jTessBoxEditor,然后配置环境变量。 1、将图片转换成tif格式的,这里需要用画图工具另存为; 2、生成box文件 执行命令: tesseract agv.normal.exp1.tif agv.normal.exp1 -l eng --psm 6 batch.nochop makebox 关于box文件…

内部类 --- (寄生的哲学)

内部类总共有 4 种(静态内部类、非静态内部类、局部内部类、匿名内部类) 作用: 一:内部类提供了更好的封装,可以把内部类隐藏在外部类之内,不允许同一个包中的其他类访问该类。 二:内部类可以…

数据结构:循环单链表

循环单链表(Circular Singly Linked List) 循环单链表是单链表的一种变体,其特点是链表的尾节点指向头节点,形成一个闭环。这种结构允许在链表中进行无缝的遍历,并且可以从任何节点开始遍历整个链表。循环单链表通常用…

Spring Boot(快速上手)

Spring Boot 零、环境配置 1. 创建项目 2. 热部署 添加依赖&#xff1a; <dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-devtools</artifactId><optional>true</optional> </dependency&…