《Keras深度学习实战》—2.4 MNIST数据集
2.4 MNIST数据集
MNIST是一个包含60 000个0~9这十个数字的28×28像素灰度图像的数据集。MNIST也包括10 000个测试集图像。数据集包含以下四个文件:
train-images-idx3-ubyte.gz:训练集图像(9 912 422字节),见http://yann.lecun.com/exdb/mnist/train-images-idx3-ubyte.gz
train-labels-idx1-ubyte.gz:训练集标签(28 881字节),见http://yann.lecun.com/exdb/mnist/train-labels-idx1-ubyte.gz
t10k-images-idx3-ubyte.gz:测试集图像(16 48 877字节),见http://yann.lecun.com/exdb/mnist/t10k-images-idx3-ubyte.gz
t10k-labels-idx1-ubyte.gz:测试集标签(4 542字节),见http://yann.lecun.com/exdb/mnist/t10k-labels-idx1-ubyte.gz
这些文件中的数据以IDX格式存储。IDX文件格式是用于存储向量与多维度矩阵的文件格式,你可以在http://www.fon.hum.uva.nl/praat/manual/IDX_file_format.html上找到IDX格式的更多信息。
上图显示了MNIST数据集表示的图像。
怎么做
使用keras.datasets.mnist将MNIST数据加载到numpy数组中:
数据集的形状输出如下:
接下来介绍如何从.csv文件加载数据。
- 点赞
- 收藏
- 关注作者
评论(0)