支持向量机（SVM）与核技巧的核心思想是什么？

Question 1

Accepted Answer

最大间隔 SVM 是判别式分类器，目标是找一个超平面把两类分开，并让间隔（margin，最近样本到超平面的距离）最大化。最大间隔意味着对噪声更鲁棒、泛化更好。优化目标是在约束「所有样本被正确分类且间隔不小于 1」下最小化权重范数，等价于一个凸二次规划，因此有全局最优解。 支持向量与软间隔 最终超平面只由落在间隔边界上的少数样本（支持向量）决定。现实数据常不可完全线性分，引入松弛变量和惩罚系数 C：C 越大越不容忍误分（易过拟合），越小间隔越宽（易欠拟合）。 核技巧 对非线性问题，把样本映射到高维空间后再线性分割。核技巧的妙处在于：对偶形式只需样本间的内积，用核函数 K(x,z) 直接给出高维内积，无需显式构造高维坐标。常用 RBF（高斯）核、多项式核，RBF 的 gamma 决定单个样本影响半径。

Question 2

为什么核技巧能避免维度灾难带来的计算爆炸？

Accepted Answer

因为对偶问题只依赖样本两两内积，核函数把高维（甚至无穷维，如 RBF）内积压缩成低维输入上的一次函数求值，计算量与映射后维度无关，只与样本数有关。

Question 3

C 和 gamma 如何影响模型？

Accepted Answer

C 大：惩罚误分重，决策面更贴合训练点，易过拟合；C 小：间隔更宽、更平滑。gamma 大：RBF 影响半径小，决策面弯曲、易过拟合；gamma 小：更平滑、易欠拟合。通常网格搜索联合调优。

Question 4

SVM 与逻辑回归如何选择？

Accepted Answer

数据量大、特征多且近似线性可分时逻辑回归更快、可输出概率；样本量中等、需要非线性边界或追求间隔最大化时 SVM（配 RBF 核）更优。SVM 不直接给概率，需额外校准。

支持向量机（SVM）与核技巧的核心思想是什么？

核心要点

标准回答

常见误区

追问

延伸学习