神经网络中权重与偏置起什么作用？

Question 1

神经网络中权重与偏置起什么作用？

Accepted Answer

在 神经网络 的线性层 y = σ(Wx + b) 中： 权重（Weights, W）： - 矩阵/向量，决定每个输入对输出的贡献强度 - 学习特征组合与方向（如边缘检测核） - 参数量通常占模型主体 偏置（Biases, b）： - 逐神经元加常数，平移决策边界 - 无偏置时超平面必须过原点，表达能力受限 - 参数量相对较小 学习过程：反向传播 计算 ∂L/∂W、∂L/∂b，优化器更新。好的初始化（Xavier/He）避免初期梯度消失/爆炸。 正则化：权重衰减主要约束 W；BatchNorm 学缩放 γ、平移 β 可视为特殊可学习参数。详见 深度学习基础 与术语 bias。

Question 2

可以不要偏置吗？

Accepted Answer

可以（bias=False），如某些 BN 后接 Conv 为减参；但多数全连接/卷积默认含 bias。无 bias 时模型表达能力略受限，数据已中心化时影响较小。

Question 3

权重共享时 bias 也共享吗？

Accepted Answer

CNN 卷积核权值共享，但每个输出通道通常有独立 bias（每个 filter 一个）。深度可分离卷积中 bias 行为类似。

Question 4

初始化为什么重要？

Accepted Answer

初始化决定前向激活和反向梯度的初始方差。全置零会让同层神经元梯度完全相同、永远学成一样（对称性无法打破）；太大易激活饱和或梯度爆炸，太小则梯度消失。Xavier/Glorot 按扇入扇出缩放适配 tanh/sigmoid，He 初始化针对 ReLU 把方差放大一倍以补偿其置零一半激活的效应，让深层网络从一开始就能稳定传播信号。

神经网络中权重与偏置起什么作用？

核心要点

简要回答

标准回答

常见误区

追问

延伸学习