如何在 TensorFlow 中构建神经网络？

Question 1

Accepted Answer

在 TensorFlow 中构建 神经网络 主要有三种方式： 1. Sequential API（线性堆叠） ``python model = tf.keras.Sequential([ tf.keras.layers.Flatten(input_shape=(28, 28)), tf.keras.layers.Dense(128, activation='relu'), tf.keras.layers.Dense(10), ]) ` 2. Functional API（多输入/分支） `python inputs = tf.keras.Input(shape=(28, 28)) x = tf.keras.layers.Flatten()(inputs) outputs = tf.keras.layers.Dense(10)(x) model = tf.keras.Model(inputs, outputs) ` 3. 子类化 Model（完全自定义 call） 训练： `python model.compile(optimizer='adam', loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True), metrics=['accuracy']) model.fit(x_train, y_train, epochs=5, validation_split=0.1) `` 数据用 tf.data.Dataset 可扩展大规模管道。部署 model.save('saved_model')。详见 深度学习基础。

Question 2

from_logits=True 什么意思？

Accepted Answer

表示传给损失的是未经 softmax/sigmoid 的原始 logits，损失函数内部自己做归一化，数值更稳定（log-sum-exp 技巧避免溢出）。所以推荐最后一层不加激活、loss 设 from_logits=True；若已加 softmax 则必须设 False。

Question 3

Functional 和 Sequential 如何选？

Accepted Answer

单输入单输出、层逐个线性堆叠用 Sequential，最简洁；一旦需要多输入/多输出、分支合并、残差连接、共享层，就必须用 Functional API（以张量为节点连成图）。需要在 forward 里写动态控制流则子类化 Model。

题库延伸：与本追问相关的专题题 → PyTorch 的 Sequential 模型是什么？与 Module 有何区别？

Question 4

如何用回调 EarlyStopping？

Accepted Answer

构造 tf.keras.callbacks.EarlyStopping(monitor="val_loss", patience=3, restore_best_weights=True)，传给 model.fit 的 callbacks 列表。监控的验证指标连续 patience 个 epoch 不改善就停训，并恢复到最佳权重，避免过拟合和浪费算力。常与 ModelCheckpoint、ReduceLROnPlateau 一起用。

如何在 TensorFlow 中构建神经网络？

核心要点

标准回答

常见误区

追问

延伸学习