标准回答
第一步:澄清业务问题
先和业务方对齐真正目标与成功标准,把「提升体验」翻译成可量化指标,比如点击率提升 X%、人工审核成本下降 Y%。确认决策如何被这个预测驱动。
第二步:判断是否适合 ML
确认问题有可学习的模式、有足够标签、且预测能带来明确收益。能用规则或简单统计解决的,不要上模型。
第三步:定义 ML 问题
明确输入(哪些特征、何时可得,避免特征穿越)、输出(分类/回归/排序/生成)、标签(怎么定义、谁来标、延迟多久)和预测粒度。
第四步:选指标与约束
选监督类型并定离线指标(如不平衡场景用 AUC/PR-AUC 而非准确率),把离线指标和业务北极星指标对齐。最后列出线上延迟、推理成本、可解释性与隐私合规等硬约束,作为方案边界。
常见误区
⚠️ 常见踩坑
上来就选模型、谈算法,却没把模糊需求翻译成可量化的成功指标和明确的输入/输出/标签定义;以及离线指标好看但与业务收益脱节。
追问
追问 1:如果业务方说不清成功指标怎么办?
用代理指标和反推法:先问「这个预测会驱动什么决策、决策做对/做错分别带来什么后果」,据此构造可衡量的代理指标。同时给出 2-3 个候选指标和阈值方案,用小范围实验或历史数据回测让业务方在具体数字上做选择,而不是抽象表态。
追问 2:怎么判断一个需求其实不该用 ML?
若规则清晰稳定(如硬性合规校验)、数据量极小或无标签、错误代价极高且不可解释不可接受、或问题本质是工程/产品问题,则不该用 ML。先用规则或统计基线跑通,证明 ML 相对基线有显著且稳定的增量收益后再投入。
延伸学习
与本题相关的知识库文章、术语、工具与行业资讯。