TensorFlow 中的 Variable 是什么？有何重要性？

Question 1

Accepted Answer

tf.Variable 是 TensorFlow 的可变张量，存储模型参数与训练中需更新的状态。 ``python W = tf.Variable(tf.random.normal([784, 10])) b = tf.Variable(tf.zeros([10])) with tf.GradientTape() as tape: logits = tf.matmul(x, W) + b loss = loss_fn(y, logits) grads = tape.gradient(loss, [W, b]) optimizer.apply_gradients(zip(grads, [W, b])) `` 重要性： 1. 可训练性：trainable_variables 列表供优化器使用 2. 持久化：checkpoint、SavedModel 保存 Variable 3. 与 Constant 区分：tf.constant 不可变，是超参或数据 4. 自动追踪：GradientTape 默认 watch Variable Keras 层内部权重即 Variable。tf.Variable(..., trainable=False) 冻结（如 BatchNorm 的 moving mean 用 moving_* 变量）。 TF 1.x Variable 需 global_variables_initializer()；2.x Eager 自动初始化。详见 深度学习基础。

Question 2

Variable 和 tf.keras.layers.Layer 权重关系？

Accepted Answer

Keras 层在 build 时通过 self.add_weight() 内部创建 tf.Variable 来保存该层的 kernel、bias 等参数，并按 trainable 与否分别收集到 layer.trainable_variables / non_trainable_variables。也就是说，层只是 Variable 的容器与组织方式；优化器最终更新的仍是这些底层 Variable。

题库延伸：与本追问相关的专题题 → PyTorch 中 Tensor 与 Variable 有何区别？

Question 3

如何冻结部分 Variable？

Accepted Answer

两种常见方式：一是把对应 Keras 层设为 layer.trainable = False（迁移学习冻结 backbone 常用，记得重新 compile）；二是在自定义训练循环里，只把需要训练的 Variable 传给 tape.gradient 和 apply_gradients，跳过要冻结的那些。冻结后这些参数不再进入梯度更新，但前向仍参与计算。

题库延伸：与本追问相关的专题题 → PyTorch 中 Tensor 与 Variable 有何区别？

Question 4

ResourceVariable 是什么？

Accepted Answer

ResourceVariable 是 TF 中基于「资源句柄」实现的 Variable，TF 2.x 的默认实现。相比早期 RefVariable，它的读写语义更明确（读取返回一份快照、写入有确定顺序），避免了旧版在并发读写时顺序不确定的坑，也更好地配合图执行与自动微分。日常用 tf.Variable 创建的就是它，一般无需直接打交道。

TensorFlow 中的 Variable 是什么？有何重要性？

核心要点

简要回答

标准回答

常见误区

追问

延伸学习