TensorFlow 中模型编译（compile）的过程是怎样的？

Question 1

Accepted Answer

TensorFlow 中「编译」有两层含义： 1. Keras model.compile()（最常见） ``python model.compile( optimizer=tf.keras.optimizers.Adam(learning_rate=1e-3), loss='sparse_categorical_crossentropy', metrics=['accuracy'], ) ` 作用是绑定优化器、损失函数与评估指标，生成内部的 train_step/test_step，但不执行任何训练。随后调用 model.fit(x, y, epochs=10) 才真正迭代更新权重。 2. @tf.function 图编译 将 Python 函数追踪（trace）为 TensorFlow 计算图，融合算子、减少 Python 解释开销，从而加速 train_step。 完整流程：build 模型 → compile → fit / train_on_batch → evaluate → save。自定义训练循环可不 compile，改为手写 GradientTape + apply_gradients`。选型上：标准监督学习用 compile + fit；GAN/RL 等需要精细控制梯度时用自定义循环。详见 深度学习训练技巧。

Question 2

compile 时能直接传字符串 loss 吗？

Accepted Answer

可以。Keras 支持字符串简写，如 loss='sparse_categorical_crossentropy'、optimizer='adam'，会映射到默认参数的对象。当需要自定义参数（如 from_logits=True、自定义学习率）时，应改传对象实例 tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True)。

Question 3

fit 和 train_on_batch 有什么区别？

Accepted Answer

fit 管理整个 epoch、验证集与回调（callbacks）；train_on_batch 只做单步更新，适合自定义数据流或强化学习。两者都依赖已 compile 的模型（除非在子类化模型中重写了 train_step）。

题库延伸：相关专题 → Batch Normalization 的作用是什么？

Question 4

未 compile 就直接 fit 会怎样？

Accepted Answer

会抛出 RuntimeError，提示「You must compile your model before training/testing」，因为此时还没有绑定 optimizer、loss，也没有生成 train_step。例外是子类化模型中自己重写了 train_step 并在其中完成梯度计算，则可不依赖 compile。

TensorFlow 中模型编译（compile）的过程是怎样的？

核心要点

标准回答

常见误区

追问

延伸学习