什么是通用近似定理？

Question 1

什么是通用近似定理？

Accepted Answer

通用近似定理（Universal Approximation Theorem, UAT） 是 神经网络 理论基石：在适当条件下，单隐藏层前馈网络只要足够宽（神经元够多），配合非线性激活（如 sigmoid、ReLU），就能在紧集上以任意精度一致逼近任意连续函数。 Cybenko (1989) / Hornik 等证明了对不同激活函数的版本。直观理解：隐藏层神经元构成一组「基函数」，输出层线性组合可拟合复杂映射。 重要局限（面试常考）： - 定理保证存在这样的权重，不保证梯度下降能找到 - 所需宽度可能指数级于输入维度，不现实 - 深度网络往往用更少参数达到同等表达能力（层次特征组合） UAT 回答「神经网络能表示什么」；泛化、优化、数据效率是另一回事。与 深度学习 中「深度」的价值形成对照：实践中靠深层结构 + 大数据 + 好优化器，而非极宽浅层。 详见 深度学习基础。

Question 2

UAT 对 ReLU 网络成立吗？

Accepted Answer

成立。ReLU 等广泛使用的激活在满足定理条件时均可；ReLU 网络可用有限宽度的分段线性函数逼近连续函数，理论界与实践中 ReLU 的主导地位一致。

Question 3

「能逼近」为何不等于「能学好」？

Accepted Answer

优化景观可能有大量局部极小；有限数据下过拟合；所需宽度不可行。深度学习成功依赖归纳偏置（CNN 局部性）、正则化、大数据与算法，远超 UAT 的存在性结论。

Question 4

深度网络的表达能力一定强于浅层吗？

Accepted Answer

对某些函数族，深度网络用多项式级参数即可表示，浅层需指数级宽度（如某些对称函数）。这是深度有效性的理论支撑之一，但具体任务还取决于架构与数据。

什么是通用近似定理？

核心要点

简要回答

标准回答

常见误区

追问

延伸学习