自定义数据集 使用scikit-learn中svm的包实现svm分类

ops/2025/2/6 9:45:50/

数据集生成:

 

- 使用  make_classification  函数生成包含1000个样本的数据集,设置20个特征,其中10个是有信息的特征,类别数为2,通过设置  random_state = 42  保证每次运行生成的数据相同。

 

数据划分:

 

- 使用  train_test_split  函数将生成的数据集划分为训练集和测试集,测试集占比为20%,同样通过  random_state = 42  保证划分的一致性。

 

SVM模型:

 

- 初始化  SVC  类,这里使用线性核函数  kernel='linear' 。还有其他核函数可供选择,如  'rbf' (径向基函数核)、 'poly' (多项式核)等,不同的核函数适用于不同的数据分布。

 

- 使用  fit  方法将模型拟合到训练集数据  X_train  和对应的标签  y_train  上。

 

预测与评估:

 

- 使用训练好的模型对测试集  X_test  进行预测,得到预测标签  y_pred 。

 

- 使用  accuracy_score  函数计算预测准确率,评估模型在测试集上的性能。

import numpy as np

from sklearn.datasets import make_classification

from sklearn.model_selection import train_test_split

from sklearn.svm import SVC

from sklearn.metrics import accuracy_score

 

 

# 生成自定义数据集

X, y = make_classification(n_samples=1000, n_features=20, n_informative=10, n_classes=2, random_state=42)

 

# 划分训练集和测试集

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

 

# 初始化并拟合SVM模型

svm_classifier = SVC(kernel='linear')

svm_classifier.fit(X_train, y_train)

 

# 预测

y_pred = svm_classifier.predict(X_test)

 

# 计算准确率

accuracy = accuracy_score(y_test, y_pred)

print(f"Accuracy of SVM classifier: {accuracy}")


http://www.ppmy.cn/ops/156119.html

相关文章

PAT甲级1052、Linked LIst Sorting

题目 A linked list consists of a series of structures, which are not necessarily adjacent in memory. We assume that each structure contains an integer key and a Next pointer to the next structure. Now given a linked list, you are supposed to sort the stru…

自定义数据集 使用pytorch框架实现逻辑回归并保存模型,然后保存模型后再加载模型进行预测,对预测结果计算精确度和召回率及F1分数

自定义数据集:继承 torch.utils.data.Dataset 类创建自定义数据集,并重写 __len__ 和 __getitem__ 方法。 定义逻辑回归模型:继承 nn.Module 类,定义一个线性层,并在 forward 方法中应用sigmoid激活函数。 训…

数据库系统概念第六版记录 一

1.关系型数据库 关系型数据库(Relational Database,简称 RDB)是基于关系模型的一种数据库,它通过表格的形式来组织和存储数据。每个表由若干行(记录)和列(字段)组成,数据…

移除元素-双指针(下标)

题目 给你一个数组 nums 和一个值 val,你需要 原地 移除所有数值等于 val 的元素。元素的顺序可能发生改变。然后返回 nums 中与 val 不同的元素的数量。 假设 nums 中不等于 val 的元素数量为 k,要通过此题,您需要执行以下操作&#xff1a…

Linux-Robust-Futex学习笔记

robust futex 简介 概述: 为了保证futex的robustness,添加了一种能够用于处理进程异常终止时锁状态的机制,就是当拥有锁的线程异常终止时,该线程能够将锁进行释放 基本原理: 每个线程都有一个私有的robust list&…

Spring Boot 实例解析:配置文件

SpringBoot 的热部署&#xff1a; Spring 为开发者提供了一个名为 spring-boot-devtools 的模块来使用 SpringBoot 应用支持热部署&#xff0c;提高开发者的效率&#xff0c;无需手动重启 SpringBoot 应用引入依赖&#xff1a; <dependency> <groupId>org.springfr…

深度学习之“线性代数”

线性代数在深度学习中是解决多维数学对象计算问题的核心工具。这些数学对象包括标量、向量、矩阵和张量&#xff0c;借助它们可以高效地对数据进行操作和建模。以下将详细介绍这些数学对象及其在深度学习中的典型用途。 数学对象概述 标量 标量是最简单的数学对象&#xff0…

算法 哈夫曼树和哈夫曼编码

目录 前言 一&#xff0c;二进制转码 二&#xff0c;哈夫曼编码和哈夫曼树 三&#xff0c;蓝桥杯 16 哈夫曼树 总结 前言 这个文章需要有一定的树的基础&#xff0c;没学过树的伙伴可以去看我博客树的文章 当我们要编码一个字符串转成二进制的时候&#xff0c;我们要怎么…