PyTorch Module 的 forward 方法起什么作用？

Question 1

Accepted Answer

在 PyTorch 中，继承 nn.Module 的类必须实现 **forward(self, *args)，定义前向传播：输入张量如何经各子层得到输出。 ``python class MyModel(nn.Module): def __init__(self): super().__init__() self.conv = nn.Conv2d(3, 64, 3) self.fc = nn.Linear(64, 10) def forward(self, x): x = F.relu(self.conv(x)) x = F.adaptive_avg_pool2d(x, 1).flatten(1) return self.fc(x) `` 调用约定：使用 model(x) 而非 model.forward(x)。nn.Module.__call__ 会在 forward 前后执行注册钩子（forward_pre_hook、forward_hook），直接调 forward 会跳过它们。 职责划分：__init__ 声明子模块与参数；forward 描述计算图连接。复杂模型可在 forward 中做分支、多输入、残差 x + self.block(x)**。 Autograd 在 forward 时建图，backward 时求导。详见 深度学习基础。

Question 2

self.training 这个标志为什么不在 __init__ 里固定，而要在 forward 里读？

Accepted Answer

self.training 是 nn.Module 的内置状态，由 model.train()/model.eval() 在运行期切换，所以应在 forward 里读取它来决定 Dropout、BN 等行为，而不能在 __init__ 里写死。__init__ 只在建模型时跑一次，写死会导致 eval 时仍走训练分支。

Question 3

forward 能有多输入多输出吗？

Accepted Answer

可以。forward 是普通 Python 方法，签名随意：def forward(self, x, mask, state=None) 支持多输入，return 一个 tuple/dict 支持多输出，调用时 model(x, mask) 即可。Transformer、检测头等都靠这个特性传 attention mask、返回多分支结果。

Question 4

torch.jit.script 对 forward 有何要求？

Accepted Answer

script 会把 forward 当作静态类型的 TorchScript 编译，要求代码是其支持的 Python 子集：变量类型尽量可推断、避免不支持的动态特性和任意第三方库调用，张量与控制流要类型一致。含复杂动态分支时可改用 torch.jit.trace（但 trace 不记录数据相关分支）或新的 torch.export。

PyTorch Module 的 forward 方法起什么作用？

核心要点

简要回答

标准回答

常见误区

追问

延伸学习