一、mnist手写数字识别
1、数据集介绍
mnist数据集是一个经典的数据集,其中包括70000个样本,包括60000个训练样本和10000个测试样本
2、下载地址:http://yann.lecun.com/exdb/mnist/
3、文件说明
train-images-idx3-ubyte.gz: training set images (9912422 bytes)
train-labels-idx1-ubyte.gz: training set labels (28881 bytes)
t10k-images-idx3-ubyte.gz: test set images (1648877 bytes)
t10k-labels-idx1-ubyte.gz: test set labels (4542 bytes)
4、特征值
每一个mnist数据单元有两部分组成:一张包含手写数字的图片和一个对应的标签。我们把这些图片设为“xs”,把这些标签设为“ys”。训练数据集和测试数据集都包含xs和ys
比如训练数据集的图片是mnist.train.images,训练数据集的标签是mnist.train.labels
我们可以知道图片是黑白图片,每一张图片包含28像素x28像素。我们把这个数组展开成一个向量。长度是28x28=784。因此,在mnist训练数据集中,mnist.train.images是一个形状为[60000, 784]的张量
5、目标值
mnist中的每个图像都具有相应的标签,0到9之间的数字表示图像中绘制的数字。用的是one-hot编码