python项目练习——4.手写数字识别

news/2025/2/14 0:13:44/

使用Python和Scikit-learn库进行机器学习模型训练的项目——手写数字识别。

项目分析:

  1. 数据准备:使用公开数据集(如MNIST)作为训练和测试数据。
  2. 数据预处理:对图像数据进行归一化、展平等操作,以便输入到机器学习模型中。
  3. 模型选择:选择一个适合的机器学习模型,如支持向量机(SVM)、随机森林或神经网络(如多层感知机MLP)。
  4. 模型训练:使用训练数据对模型进行训练。
  5. 模型评估:使用测试数据对训练好的模型进行评估,计算准确率等指标。

 首先,确保您已经安装了scikit-learn和numpy库。如果没有安装,可以通过pip进行安装:

pip install scikit-learn numpy

编写代码:

import numpy as np  
from sklearn import datasets, svm, metrics  
from sklearn.model_selection import train_test_split  
from sklearn.preprocessing import StandardScaler  
from sklearn.neural_network import MLPClassifier  
  
# 1. 数据准备  
# 加载MNIST数据集  
digits = datasets.load_digits()  
  
# 2. 数据预处理  
# 将图像数据展平为一维数组  
n_samples = len(digits.images)  
data = digits.images.reshape((n_samples, -1))  
  
# 划分训练集和测试集  
X_train, X_test, y_train, y_test = train_test_split(data, digits.target, test_size=0.5, shuffle=False)  
  
# 数据标准化  
scaler = StandardScaler()  
X_train = scaler.fit_transform(X_train)  
X_test = scaler.transform(X_test)  
  
# 3. 模型选择  
# 使用多层感知机(MLP)作为分类器  
mlp = MLPClassifier(hidden_layer_sizes=(50,), max_iter=10, alpha=1e-4,  
                    solver='sgd', verbose=10, random_state=1,  
                    learning_rate_init=.1)  
  
# 4. 模型训练  
mlp.fit(X_train, y_train)  
  
# 5. 模型评估  
# 预测测试集结果  
predictions = mlp.predict(X_test)  
  
# 计算准确率  
print("Classification report for classifier %s:\n%s\n"  
      % (mlp, metrics.classification_report(y_test, predictions)))  
print("Confusion matrix:\n%s" % metrics.confusion_matrix(y_test, predictions))


http://www.ppmy.cn/news/1396896.html

相关文章

分布式系统面试全集通第一篇(dubbo+redis+zookeeper----分布式+CAP+BASE+分布式事务+分布式锁)

目录 分布式系统面试全集通第一篇什么是分布式?和微服务的区别什么是分布式分布式与微服务的区别 什么是CAP?为什么不能三者同时拥有分区容错性一致性可用性 Base理论了解吗基本可用软状态最终一致性 什么是分布式事务分布式事务有哪些常见的实现方案?2PC(Two Ph…

【目标检测】NMS算法的理论讲解

将NMS就必须先讲IOU, IOU就是交并比,两个检测框的交集除以两个检测框的并集就是IOU 为什么要做NMS操作,因为要去除同一个物体的多的冗余检测框 那么NMS算法是如何做的呢? 以上是算法的流程图 下面讲解算法的流程 首先输入是预…

服务器中有g++,但是查询不到,Command ‘g++‘ not found

有gcc但是查询不到g,gcc版本为9.5.0 (base) zyICML:~$ g -V Command g not found, but can be installed with: apt install g Please ask your administrator. 突然就出现这个问题,导致detectron装不上,现在有时间了专门研究下怎么解决 这…

【工具】Raycast – Mac提效工具

🌈个人主页: 鑫宝Code 🔥热门专栏: 闲话杂谈| 炫酷HTML | JavaScript基础 ​💫个人格言: "如无必要,勿增实体" 引入 以前看到同事们锁屏的时候,不知按了什么键,直接调出这个框&a…

git提交和回退

目录 一. git 提交二. git commit 后准备回退,尚未 git push三. git add 添加多余文件 撤销操作四. 更改 Git commit 的默认编辑器五. 撤销某个commit的变更六. 回退到之前的commit状态总结: 一. git 提交 git pull # 更新代码 git status # 查看代码状…

高速行者,5G工业路由器助力车联网无缝通信

随着5G技术的飞速发展,智能制造正迎来一个全新的时代。5G工业路由器作为车联网的核心设备,正在发挥着关键的作用。它不仅提供高速稳定的网络连接,还支持大规模设备连接和高密度数据传输,为车辆之间的实时通信和信息交换提供了强有…

[NCNN学习笔记]-4

1、前言 继续学习NCNN。本次学习binaryop和eltwise。 2、学习内容 2.1、binaryop binaryop是用来二元计算的op,先来看binaryop.h的中关于二元计算的定义,其中二元计算定义了如下操作。 enum OperationType {Operation_ADD 0,Operation_SUB 1,Oper…

在 nginx 中使用 JavaScript

前些日子尝试了在 nginx 中写 JavaScript 的效果。考虑到 JavaScript 作为编程语言不是强需求,在nginx生态上还是 lua 独大,并且还有 openresty 这样一直强力输血,大部分应用场景都能找到参考的解决方案。 插件生态来说,github 上…