什么是 DataOps？它与 MLOps 有何关系？

Question 1

Accepted Answer

DataOps：将 DevOps 原则应用于数据流水线——自动化、测试、监控、协作，确保数据可靠、及时、可溯源。 核心实践： - 数据契约（Data Contract）：上下游约定 schema、SLA、质量指标 - 自动化测试：空值率、分布漂移、唯一性约束 - 血缘（Lineage）：追踪字段从源表到特征/模型的路径 - 编排：Airflow/Dagster 调度 ETL，可观测失败重试 与 MLOps 关系： `` DataOps（数据层）→ Feature Store → MLOps（模型层）→ Serving `` DataOps MLOps --------- ------- 数据质量、ETL 模型训练、部署 Schema 演进 模型版本演进 数据目录 模型注册表 协同：MLOps 模型退化时，根因常在数据（上游表变更、采样偏差）——需 DataOps 血缘快速定位。详见 MLOps 入门。

Question 2

数据契约违反时 ML 流水线应如何反应？

Accepted Answer

应在流水线入口做校验并 fail fast：检测到 schema 变更或质量指标越界（如某字段空值率骤增）就阻断下游训练/特征生成并告警，而不是带着脏数据继续训练上线。可对非关键问题降级（隔离坏分区继续跑），关键违约则停流并通知上游 owner。

Question 3

Feature Store 算 DataOps 还是 MLOps？

Accepted Answer

它处在两者交界。下半部分（数据采集、转换、materialize、质量校验）属 DataOps 范畴；上半部分（特征版本、训练/serving 一致性、被模型消费）服务于 MLOps。实践中它正是连接 DataOps 与 MLOps 的桥梁。

Question 4

实时数据质量如何监控？

Accepted Answer

在流式管道里对每批/窗口数据计算质量指标（到达延迟、空值率、取值范围、分布漂移），与基线对比超阈值即告警；用 Kafka/Flink 内嵌校验或 Great Expectations 等做断言。关键是低延迟告警并能定位到具体上游分区。

什么是 DataOps？它与 MLOps 有何关系？

核心要点

标准回答

常见误区

追问

延伸学习


DataOps	MLOps
数据质量、ETL	模型训练、部署
Schema 演进	模型版本演进
数据目录	模型注册表