TensorFlow 中的 Placeholder 是什么？如何使用？

Question 1

Accepted Answer

Placeholder 是 TensorFlow 1.x 静态图中的输入占位符： ``python TF 1.x x = tf.placeholder(tf.float32, shape=[None, 784], name='input') y_pred = tf.matmul(x, W) + b with tf.Session() as sess: out = sess.run(y_pred, feed_dict={x: batch_numpy}) `` 作用： - 建图时形状/类型已知，值运行时注入 - 同一图复用不同 batch（None 表示可变 batch 维） - 与 Variable（参数）区分：Placeholder 是输入数据 TF 2.x：已废弃。Eager 下直接 model(tf.constant(batch)) 或 model(batch_tensor)；tf.function 用函数参数代替 placeholder。 维护 legacy 代码或读老教程需理解 placeholder + feed_dict + Session 三位一体。新项目勿用。详见 TensorFlow 迁移指南。

Question 2

placeholder 的 shape 中 None 是什么含义？

Accepted Answer

None 表示该维度大小在建图时未知、运行时才确定，最常见于 batch 维（如 [None, 784]），这样同一张图既能喂 32 条也能喂 256 条数据，无需为每种 batch 大小重建图。

Question 3

feed_dict 除了 placeholder 还能喂什么？

Accepted Answer

理论上 feed_dict 可以覆盖图中任意张量的值（包括中间结果或 Variable），用于调试时强行替换某个节点的输出；但常规用法只喂 placeholder，覆盖其他节点会绕过计算、容易引入隐藏 bug。

Question 4

TF 2.x 如何等价实现可变 batch？

Accepted Answer

直接定义 forward 函数把输入作为参数即可，batch 维天然可变；若用 @tf.function 编译，可在 input_signature 里用 tf.TensorSpec(shape=[None, 784]) 显式声明可变维，避免不同 batch 大小触发重复 retrace。

TensorFlow 中的 Placeholder 是什么？如何使用？

核心要点

标准回答

常见误区

追问

延伸学习