核心要点

  • 核心角色:产品经理、数据工程、数据科学/算法、ML 工程、MLOps/平台、标注、领域专家

  • 产品定目标与指标,数据工程供数据管道,算法做建模,ML 工程做工程化落地

  • 协作靠清晰交接物:数据契约、模型契约(输入输出/SLA)、模型卡

  • 全团队对齐同一套北极星指标,避免各自优化局部指标导致冲突

标准回答

主要角色与职责

  • 产品经理:定义业务目标、成功指标与优先级;
  • 数据工程:搭建数据管道、保障数据质量与可用性;
  • 数据科学/算法:做问题建模、特征设计、模型训练与离线评估;
  • ML 工程:把模型工程化,做特征服务、推理服务、性能优化;
  • MLOps/平台:流水线、CI/CD、监控、版本与实验追踪;
  • 标注团队:产出高质量标签;
  • 领域专家:提供业务知识,参与标注规范与结果审校。

如何协作

协作的关键不是堆人,而是清晰的交接物。数据工程和算法之间约定数据契约(schema、口径、更新频率);算法和 ML 工程之间约定模型契约(输入输出格式、特征一致性、延迟 SLA)。

对齐共同指标

全团队对齐同一套业务北极星指标和离线评估口径,避免算法只盯 AUC、产品只盯 GMV 而方向打架。用例会、共享看板和文档把上下游串起来。

常见误区

⚠️ 常见踩坑

把团队等同于「算法工程师」单角色,忽视数据工程、ML 工程和 MLOps;以及交接靠口头沟通而无数据契约/模型契约,导致线上线下特征不一致。

追问

追问 1小团队人手不足时角色如何取舍?

小团队会一人多岗,但不能省掉职责。优先保证数据质量(数据工程)和工程化落地(ML 工程),因为它们决定模型能否上线稳定运行。算法可先用成熟模型/API 快速验证,把精力放在数据和迭代上。MLOps 可用现成平台(实验追踪、模型注册)替代专职人力。

追问 2算法和工程经常「扯皮」,怎么减少摩擦?

根因多是缺乏明确边界与契约。建立模型契约(输入输出 schema、特征来源、延迟/吞吐 SLA)和共享的特征平台保证训练-服务一致;交接时附模型卡、评测报告和冒烟测试;用统一线上监控让双方看同一组指标,对事不对人地定位问题。

延伸学习

与本题相关的知识库文章、术语、工具与行业资讯。