核心要点

  • 先澄清业务目标与可量化的成功指标(如「降低坏账率 2%」),而非直接谈模型

  • 判断是否真的需要 ML:规则/统计能解决就别上模型;要有可学习的模式且有标签

  • 明确定义输入特征、输出形式、标签来源与预测粒度(按用户/订单/会话)

  • 选监督类型与离线评估指标,并把离线指标和业务指标对齐,列出延迟/成本/合规约束

标准回答

第一步:澄清业务问题

先和业务方对齐真正目标与成功标准,把「提升体验」翻译成可量化指标,比如点击率提升 X%、人工审核成本下降 Y%。确认决策如何被这个预测驱动。

第二步:判断是否适合 ML

确认问题有可学习的模式、有足够标签、且预测能带来明确收益。能用规则或简单统计解决的,不要上模型。

第三步:定义 ML 问题

明确输入(哪些特征、何时可得,避免特征穿越)、输出(分类/回归/排序/生成)、标签(怎么定义、谁来标、延迟多久)和预测粒度。

第四步:选指标与约束

选监督类型并定离线指标(如不平衡场景用 AUC/PR-AUC 而非准确率),把离线指标和业务北极星指标对齐。最后列出线上延迟、推理成本、可解释性与隐私合规等硬约束,作为方案边界。

常见误区

⚠️ 常见踩坑

上来就选模型、谈算法,却没把模糊需求翻译成可量化的成功指标和明确的输入/输出/标签定义;以及离线指标好看但与业务收益脱节。

追问

追问 1如果业务方说不清成功指标怎么办?

用代理指标和反推法:先问「这个预测会驱动什么决策、决策做对/做错分别带来什么后果」,据此构造可衡量的代理指标。同时给出 2-3 个候选指标和阈值方案,用小范围实验或历史数据回测让业务方在具体数字上做选择,而不是抽象表态。

追问 2怎么判断一个需求其实不该用 ML?

若规则清晰稳定(如硬性合规校验)、数据量极小或无标签、错误代价极高且不可解释不可接受、或问题本质是工程/产品问题,则不该用 ML。先用规则或统计基线跑通,证明 ML 相对基线有显著且稳定的增量收益后再投入。

延伸学习

与本题相关的知识库文章、术语、工具与行业资讯。