核心要点

  • 分类:预测的目标是离散类别,答案是「属于哪一类」,如邮件是否垃圾、图片是猫还是狗。

  • 回归:预测的目标是连续数值,答案是「具体多少」,如房价、明天气温、用户停留时长。

  • 关键看标签类型:可数的有限类别用分类,连续可比大小的数值用回归。

  • 两者常用的损失函数和评估指标不同:分类看准确率/F1,回归看误差大小(如均方误差)。

标准回答

核心区别在于预测目标的类型

分类和回归都是监督学习,区别在于要预测的标签是「类别」还是「数值」。

分类:回答「是哪一类」

输出是有限的离散类别。比如判断一封邮件是不是垃圾邮件(是/否,两类),或识别一张图片是猫、狗还是兔子(多类)。分类结果之间没有大小关系,"猫"不比"狗"大。

回归:回答「是多少」

输出是连续的数值。比如根据房子信息预测房价、根据历史预测明天的温度。结果可以比较大小、做加减,相差 1 元和相差 100 万元意义完全不同。

一个判断技巧:问自己「答案能不能排成连续的数轴」。能(如价格、温度)就是回归;只能落在几个固定桶里(如是/否、猫/狗)就是分类。

常见误区

⚠️ 常见踩坑

看到数字标签不一定是回归。比如「评分 1-5 星」如果当成几个固定等级来判别就是分类;而像「邮编」这种数字其实是类别,不能当连续数值做回归。要看数字本身能否比较大小、做运算。

追问

追问 1逻辑回归(Logistic Regression)是分类还是回归?

名字里有「回归」,但它其实是分类算法。它输出一个 0 到 1 之间的概率,再用阈值(如 0.5)判断属于哪一类,常用于二分类。名字是历史原因造成的,容易误导初学者。

追问 2分类和回归的评估指标为什么不一样?

因为目标性质不同。分类关心「判对了没」,所以用准确率、精确率召回率、F1 这类指标;回归关心「预测值离真实值差多远」,所以用均方误差、平均绝对误差等衡量数值误差的大小。

延伸学习

与本题相关的知识库文章、术语、工具与行业资讯。