标准回答
主要角色与职责
- 产品经理:定义业务目标、成功指标与优先级;
- 数据工程:搭建数据管道、保障数据质量与可用性;
- 数据科学/算法:做问题建模、特征设计、模型训练与离线评估;
- ML 工程:把模型工程化,做特征服务、推理服务、性能优化;
- MLOps/平台:流水线、CI/CD、监控、版本与实验追踪;
- 标注团队:产出高质量标签;
- 领域专家:提供业务知识,参与标注规范与结果审校。
如何协作
协作的关键不是堆人,而是清晰的交接物。数据工程和算法之间约定数据契约(schema、口径、更新频率);算法和 ML 工程之间约定模型契约(输入输出格式、特征一致性、延迟 SLA)。
对齐共同指标
全团队对齐同一套业务北极星指标和离线评估口径,避免算法只盯 AUC、产品只盯 GMV 而方向打架。用例会、共享看板和文档把上下游串起来。
常见误区
⚠️ 常见踩坑
把团队等同于「算法工程师」单角色,忽视数据工程、ML 工程和 MLOps;以及交接靠口头沟通而无数据契约/模型契约,导致线上线下特征不一致。
追问
追问 1:小团队人手不足时角色如何取舍?
小团队会一人多岗,但不能省掉职责。优先保证数据质量(数据工程)和工程化落地(ML 工程),因为它们决定模型能否上线稳定运行。算法可先用成熟模型/API 快速验证,把精力放在数据和迭代上。MLOps 可用现成平台(实验追踪、模型注册)替代专职人力。
追问 2:算法和工程经常「扯皮」,怎么减少摩擦?
根因多是缺乏明确边界与契约。建立模型契约(输入输出 schema、特征来源、延迟/吞吐 SLA)和共享的特征平台保证训练-服务一致;交接时附模型卡、评测报告和冒烟测试;用统一线上监控让双方看同一组指标,对事不对人地定位问题。
延伸学习
与本题相关的知识库文章、术语、工具与行业资讯。