自定义数据集 ,使用朴素贝叶斯对其进行分类

ops/2025/2/6 0:00:44/

数据集定义:

 

-  data  列表包含了文本样本及其对应的情感标签。每个元素是一个元组,第一个元素是文本,第二个元素是标签。

 

特征提取:

 

- 使用  CountVectorizer  将文本转换为词频向量。 fit_transform  方法在训练数据上拟合向量器并进行转换。

 

模型训练:

 

- 初始化  MultinomialNB  模型,这是适用于离散数据(如词频)的朴素贝叶斯分类器。

 

- 使用  fit  方法在提取的特征和标签上训练模型。

 

预测:

 

- 对新的文本数据,先使用  vectorizer.transform  方法将其转换为特征向量,然后使用训练好的模型进行预测。

 

评估:

 

- 这里简单地假设了新文本的真实标签,使用  accuracy_score  计算预测准确率。在实际应用中,应使用独立的测试集来评估模型性能。

import numpy as np
from sklearn.naive_bayes import GaussianNB
from sklearn.metrics import accuracy_score


# 自定义数值型数据集
X = np.array([
    [1, 2],
    [2, 3],
    [3, 4],
    [4, 5]
])
y = np.array([0, 0, 1, 1])

# 初始化并训练高斯朴素贝叶斯模型
clf = GaussianNB()
clf.fit(X, y)

# 新数据进行预测
new_X = np.array([
    [1.5, 2.5],
    [3.5, 4.5]
])
predictions = clf.predict(new_X)

# 输出预测结果
for new_data, pred in zip(new_X, predictions):
    print(f"Data: {new_data}, Prediction: {pred}")

# 假设我们有真实标签用于计算准确率(这里只是示例,实际应用中需有真实测试集标签)
true_labels = [0, 1]
accuracy = accuracy_score(true_labels, predictions)
print(f"Accuracy: {accuracy}")


 


http://www.ppmy.cn/ops/156003.html

相关文章

Van-Nav:新年,将自己学习的项目地址统一整理搭建自己的私人导航站,供自己后续查阅使用,做技术的同学应该都有一个自己网站的梦想

嗨,大家好,我是小华同学,关注我们获得“最新、最全、最优质”开源项目和高效工作学习方法 Van-Nav是一个基于Vue.js开发的导航组件库,它提供了多种预设的样式和灵活的配置选项,使得开发者可以轻松地定制出符合项目需求…

html中的表格属性以及合并操作

表格用table定义,标签标题用caption标签定义;用tr定义表格的若干行;用td定义若干个单元格;(当单元格是表头时,用th标签定义)(th标签会略粗于td标签) table的整体外观取决…

mac安装wireshark

mac启动wireshark时,提示没有权限抓包,报错内容如下: “The capture session could not be initiated on interface ‘en0’ (You don’t have permission to capture on that device). Please check to make sure you have sufficient perm…

Oracle日常管理(8)——OS日常管理(1)

8. Oracle日常管理 8.1. OS日常管理 8.1.1. OS系统日志 1)概念 服务器操作系统(OS)日常运行时,一般会生成系统日志并将其记录到相关文件中,这些日志会记录系统中一些重要配置、修改和报错等相关信息。运维人员、DBA或其他相关技术人员通过检查这些日志文件,可以对系统…

vscode+vue3+高得地图开发过过程中本地视频及地图json文件的发布问题

很久没发blog了,最近vscodevue3高得地图开发中,因为有开发的视频教程,还有地图的边界的.json文件,这些静态文件发布时,如果处理不当,build命令会将这些静态文件进行打包。打包后文件名变化了,这…

【单层神经网络】基于MXNet的线性回归实现(底层实现)

写在前面 刚开始先从普通的寻优算法开始,熟悉一下学习训练过程下面将使用梯度下降法寻优,但这大概只能是局部最优,它并不是一个十分优秀的寻优算法 整体流程 生成训练数据集(实际工程中,需要从实际对象身上采集数据…

Node.js与嵌入式开发:打破界限的创新结合

文章目录 一、Node.js的本质与核心优势1.1 什么是Node.js?1.2 嵌入式开发的范式转变二、Node.js与嵌入式结合的四大技术路径2.1 硬件交互层2.2 物联网协议栈2.3 边缘计算架构2.4 轻量化运行时方案三、实战案例:智能农业监测系统3.1 硬件配置3.2 软件架构3.3 核心代码片段四、…

深入探究 Spring 中 FactoryBean 注册服务的实现与原理

深入探究 Spring 中 FactoryBean 注册服务的实现与原理 引言 在 Spring 框架里,FactoryBean 是一个强大且重要的特性。它允许开发者以一种更加灵活的方式来创建和管理 Bean 对象。FactoryBeanRegistrySupport 和 AbstractBeanFactory 这两个类在处理 FactoryBean …