机器学习经典算法(scikit-learn)

news/2024/12/19 14:04:16/

安装库:pip install scikit-learn numpy

  1. 线性回归 (Linear Regression)

在这里插入图片描述

import numpy as np  
import pandas as pd  
from sklearn.model_selection import train_test_split  
from sklearn.linear_model import LinearRegression  
from sklearn.datasets import load_boston  # 加载数据  
boston = load_boston()  
X = boston.data  
y = boston.target  # 划分数据集  
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)  # 创建线性回归模型  
model = LinearRegression()  
model.fit(X_train, y_train)  # 预测  
predictions = model.predict(X_test)  
print(predictions)
  1. Logistic 回归 (Logistic Regression)

在这里插入图片描述

from sklearn.datasets import load_iris  
from sklearn.linear_model import LogisticRegression  # 加载数据  
iris = load_iris()  
X = iris.data  
y = iris.target  # 选择二分类问题  
X_bin = X[y != 2]  
y_bin = y[y != 2]  # 划分数据集  
X_train, X_test, y_train, y_test = train_test_split(X_bin, y_bin, test_size=0.2, random_state=42)  # 创建Logistic回归模型  
model = LogisticRegression()  
model.fit(X_train, y_train)  # 预测  
predictions = model.predict(X_test)  
print(predictions)
  1. 线性判别分析 (Linear Discriminant Analysis, LDA)

在这里插入图片描述

from sklearn.discriminant_analysis import LinearDiscriminantAnalysis  # 使用上面的鸢尾花数据  
lda = LinearDiscriminantAnalysis()  
lda.fit(X_train, y_train)  # 预测  
predictions = lda.predict(X_test)  
print(predictions)
  1. 决策树 (Decision Tree)
    在这里插入图片描述
from sklearn.tree import DecisionTreeClassifier  # 创建决策树模型  
tree_model = DecisionTreeClassifier(random_state=42)  
tree_model.fit(X_train, y_train)  # 预测  
predictions = tree_model.predict(X_test)  
print(predictions)
  1. 朴素贝叶斯 (Naive Bayes)

在这里插入图片描述

from sklearn.naive_bayes import GaussianNB  # 创建朴素贝叶斯模型  
nb_model = GaussianNB()  
nb_model.fit(X_train, y_train)  # 预测  
predictions = nb_model.predict(X_test)  
print(predictions)
  1. K 最近邻算法 (K-Nearest Neighbors)

在这里插入图片描述

from sklearn.neighbors import KNeighborsClassifier  # 创建KNN模型  
knn_model = KNeighborsClassifier(n_neighbors=3)  
knn_model.fit(X_train, y_train)  # 预测  
predictions = knn_model.predict(X_test)  
print(predictions)
  1. 学习向量量化 (Learning Vector Quantization)
    学习向量量化可以使用 KNN 的变种,通常在实际使用中与 KNN 一起。
    在这里插入图片描述

  2. 支持向量机 (Support Vector Machine)

在这里插入图片描述

from sklearn.svm import SVC  # 创建支持向量机模型  
svm_model = SVC(kernel='linear')  
svm_model.fit(X_train, y_train)  # 预测  
predictions = svm_model.predict(X_test)  
print(predictions)
  1. 袋装法和随机森林 (Bagging and Random Forest)

在这里插入图片描述

 from sklearn.ensemble import RandomForestClassifier  # 创建随机森林模型  
rf_model = RandomForestClassifier(n_estimators=100, random_state=42)  
rf_model.fit(X_train, y_train)  # 预测  
predictions = rf_model.predict(X_test)  
print(predictions)

http://www.ppmy.cn/news/1556394.html

相关文章

《Amazon Bedrock vs ChatGPT:谁更胜一筹?》

在生成性AI技术的赛道上,Amazon Bedrock和ChatGPT无疑是两大热门名字。两者虽然都在人工智能的领域大展拳脚,但它们的设计理念、功能侧重点和应用场景却大不相同。那么,作为开发者或企业用户,选择这两者中的哪一个更为合适呢&…

OpenCV中的边缘检测和轮廓处理

在图像处理和计算机视觉任务中,边缘检测和轮廓处理是非常重要的步骤。OpenCV库提供了多种函数来实现这些功能,包括Sobel算子、Laplacian算子、Canny算子、findContours函数、drawContours函数以及透视变换函数等。本文将详细介绍这些函数的功能、参数、返…

MFC 自定义网格控件

一、什么是 Custom Control? Custom Control(自定义控件) 是 MFC(Microsoft Foundation Classes)框架中提供的一种控件类型,用于实现自定义的外观和功能。当标准控件(例如 CEdit、CButton、CLi…

ip地址暴露了怎么办?手机怎样改ip地址以保障安全

在数字化时代,IP地址作为我们连接互联网的“身份证”,其安全性至关重要。然而,有时我们的IP地址可能会因各种原因暴露,从而引发隐私泄露、网络攻击等风险。本文将为您详细解析IP地址暴露后的应对措施,特别是针对手机用…

python之求平面离散点集围成的面积

鞋带公式(Shoelace Formula)是一种计算多边形面积的数学公式,特别适用于已知顶点坐标的多边形。这个公式的名字来源于计算过程中的交叉相乘,类似于系鞋带时的交叉方式。 假设一个多边形有 个顶点,顶点的坐标依次为&am…

基于微信小程序的小区疫情防控ssm+论文源码调试讲解

第2章 程序开发技术 2.1 Mysql数据库 为了更容易理解Mysql数据库,接下来就对其具备的主要特征进行描述。 (1)首选Mysql数据库也是为了节省开发资金,因为网络上对Mysql的源码都已进行了公开展示,开发者根据程序开发需…

深入理解数据库 JOIN 操作

数据库中的JOIN操作是关系型数据库查询中的重要组成部分,它允许我们将多个表的数据结合起来,形成一个新的结果集。你可能已经在不同场景下使用过它,但今天我们将深入探讨JOIN的各种类型、实际应用以及如何高效使用它。 什么是 JOIN 操作&…

跑步训练(蓝桥杯2020试题A)

【问题描述】 小明要进行一个跑步训练。初始时,小明体力充沛,体力值计为10000。小明跑步时每分钟损耗600体力值。小明休息时每分钟增加300体力值。体力值的损耗和增加都是均匀变化的。 小明打算跑一分钟,休息一分钟,再跑一分钟&am…