TensorFlow2 入门指南 | 14 网络模型的装配、训练与评估
前言:
本专栏在保证内容完整性的基础上,力求简洁,旨在让初学者能够更快地、高效地入门TensorFlow2 深度学习框架。如果觉得本专栏对您有帮助的话,可以给一个小小的三连,各位的支持将是我创作的最大动力!
系列文章汇总:TensorFlow2 入门指南
Github项目地址:https://github.com/Keyird/TensorFlow2-for-beginner
经过前面的两篇文章:
- TensorFlow2 入门指南 | 12 tf.keras.Sequential 搭建简单网络模型
- TensorFlow2 入门指南 | 13 Keras Functional API 搭建复杂网络模型
我们学会了如何去搭建简单和复杂的网络模型,网络搭建好意味着成功了一半,下面就是模型的装配、训练和评估环节!
一、模型的装配
通过模型装配可以指定模型训练时的损失函数、评价指标和优化器,TensorFLow 提供了内部函数 compile() 进行模型的装配。
compile函数定义如下:
compile(
optimizer='rmsprop', loss=None, metrics=None, loss_weights=None,
weighted_metrics=None, run_eagerly=None, steps_per_execution=None, **kwargs
)
- 1
- 2
- 3
- 4
函数重要参数解释如下:
参数 | 解释 |
---|---|
optimizer | 优化器 |
loss | 损失函数 |
metrics | 评价指标 |
… | … |
其中,metrics 参数为列表,你的模型可以具有任意数量的指标。
下面给出一个简单的例子:
model.compile(
optimizer=keras.optimizers.RMSprop(learning_rate=1e-3),
loss=keras.losses.SparseCategoricalCrossentropy(),
metrics=[keras.metrics.SparseCategoricalAccuracy()],
)
- 1
- 2
- 3
- 4
- 5
注:如果你的模型具有多个输出,则可以为每个输出指定不同的损失和指标,并且可以调整每个输出对模型总损失的贡献,后面的文章将会带你具体了解。
TensorFLow 提供许多内置优化器、损失函数和评价指标。对于初学者来说,你不必从头开始创建自己的损失、指标或优化器,可以选择直接调用:
当然,对于进阶者而言,需要进一步掌握如何自定义损失函数、评价指标,这也是我在后面文章中将要带大家学习的内容。
二、模型的训练
当模型搭建、装配完毕,就可以进行模型的训练了。TensorFlow 提供了内置函数 fit() 来进行模型训练。函数定义如下:
fit(
x=None, y=None, batch_size=None, epochs=1, verbose='auto',
callbacks=None, validation_split=0.0, validation_data=None, shuffle=True,
class_weight=None, sample_weight=None, initial_epoch=0, steps_per_epoch=None,
validation_hsteps=None, validation_batch_size=None, validation_freq=1,
max_queue_size=10, workers=1, use_multiprocessing=False
)
- 1
- 2
- 3
- 4
- 5
- 6
- 7
函数重要参数解释如下:
参数 | 解释 |
---|---|
x | 训练输入样本 |
y | 训练输入标签 |
batch_size | 一次迭代的样本数 |
epochs | 训练轮数 |
validation_data | 验证集 |
… | … |
具体可参考:https://tensorflow.google.cn/api_docs/python/tf/keras/Model
下面给出一个简单的例子:
history = model.fit(
x_train,
y_train,
batch_size=64,
epochs=10,
validation_data=(x_val, y_val),
)
- 1
- 2
- 3
- 4
- 5
- 6
- 7
三、模型的评估
模型进行训练时,想要知道模型泛化性能如何,就需要同步对测试机进行评估,从而作为评估模型训练好坏的标准之一。
在TensorFlow中,提供了evaluate()函数方便开发者使用,其定义如下:
evaluate(
x=None, y=None, batch_size=None, verbose=1, sample_weight=None, steps=None,
callbacks=None, max_queue_size=10, workers=1, use_multiprocessing=False,
return_dict=False, **kwargs
)
- 1
- 2
- 3
- 4
- 5
函数重要参数解释如下:
参数 | 解释 |
---|---|
x | 测试输入样本 |
y | 测试输入标签 |
batch_size | 一次测试输入的样本数 |
… | … |
下面给出一个简单的例子:
results = model.evaluate(x_test, y_test, batch_size=128)
- 1
四、小试牛刀
根据以上学习内容,针对MNIST数据集,实现手写数字识别。下面分别进行:数据集加载、模型搭建、模型装配、模型训练、评估测试集。完整代码如下:
"""
note: compile/fit/evaluate
author: AI JUN
date: 2022/1/5
"""
from tensorflow import keras
from tensorflow.keras import layers
# 数据集准备
(x_train, y_train), (x_test, y_test) = keras.datasets.mnist.load_data()
x_train = x_train.reshape(60000, 784).astype("float32") / 255.
x_test = x_test.reshape(10000, 784).astype("float32") / 255.
y_train = y_train.astype("float32")
y_test = y_test.astype("float32")
# 训练集
x_train = x_train[:-10000]
y_train = y_train[:-10000]
# 验证集
x_val = x_train[-10000:]
y_val = y_train[-10000:]
# 网络搭建
model = keras.Sequential([
layers.Dense(64, activation="relu", name="layer1"),
layers.Dense(64, activation="relu", name="layer2"),
layers.Dense(10, activation="softmax", name="predictions"),
])
model.build(input_shape=[None, 28*28])
# 模型的装配
model.compile(
optimizer=keras.optimizers.RMSprop(), # Optimizer
loss=keras.losses.SparseCategoricalCrossentropy(),
metrics=[keras.metrics.SparseCategoricalAccuracy()],
)
# 模型的训练
history = model.fit(
x_train,
y_train,
batch_size=64,
epochs=10,
validation_data=(x_val, y_val), # at the end of each epoch
)
# 评估测试集
print("Evaluate on test data")
results = model.evaluate(x_test, y_test, batch_size=128)
print("test loss, test acc:", results)
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
- 21
- 22
- 23
- 24
- 25
- 26
- 27
- 28
- 29
- 30
- 31
- 32
- 33
- 34
- 35
- 36
- 37
- 38
- 39
- 40
- 41
- 42
- 43
- 44
- 45
- 46
- 47
- 48
- 49
- 50
- 51
- 52
- 53
代码运行结果:
本教程所有代码会逐渐上传github仓库:https://github.com/Keyird/TensorFlow2-for-beginner
如果对你有帮助的话,欢迎star收藏~
最好的关系是互相成就,各位的「三连」就是【AI 菌】创作的最大动力,我们下期见!
文章来源: ai-wx.blog.csdn.net,作者:AI 菌,版权归原作者所有,如需转载,请联系作者。
原文链接:ai-wx.blog.csdn.net/article/details/122331291
- 点赞
- 收藏
- 关注作者
评论(0)