什么是特征商店？在 MLOps 中为何重要？

Question 1

Accepted Answer

特征商店（Feature Store）：组织内特征的「单一数据源」——统一定义、版本化、供离线训练与在线推理复用。 解决的核心问题： 1. Training-Serving Skew：离线用 SQL 算特征，在线用 Java 重写，逻辑不一致导致线上性能暴跌 2. 特征重复建设：各团队重复写相同 user_7d_click 特征 3. 点-in-time 正确性：训练只能用「预测时刻之前」的特征，防标签泄漏 架构组件： - 离线存储：Hive/S3，批量回溯历史特征 - 在线存储：Redis/DynamoDB 低延迟 lookup - 特征定义层：Python/SQL 声明式 API，一处定义两处 materialize 工作流： 1. 定义特征 + 转换逻辑 2. 离线 backfill 生成训练集（point-in-time join） 3. 流/批更新在线 store 4. 推理时 low-latency 读取相同特征 代表：Feast（开源）、Tecton、Hopsworks。详见 MLOps 入门、特征工程。

Question 2

什么是 point-in-time join？

Accepted Answer

按每条样本的标签时间戳，只关联该时刻及之前已知的特征值，避免用到未来信息造成标签泄漏。例如预测某用户 T 时刻是否点击，特征只能取 T 之前的累计点击数。它是生成训练集的正确性核心，普通 join 容易把未来特征混入。

Question 3

没有特征商店的小团队怎么办？

Accepted Answer

不必上重型平台。先用约定俗成的轻方案：把特征计算抽成可被训练与 serving 共同 import 的函数库，保证两端逻辑一致；用 DVC/版本化表管理特征数据；在线缓存放 Redis。等特征复用与团队规模上来再引入 Feast 等。

Question 4

实时特征 vs 批特征如何选型？

Accepted Answer

看特征对时效的敏感度与成本。会随会话快速变化、对预测影响大的（如最近 5 分钟点击）需实时流式计算；变化慢、可隔天的（如用户历史画像）用批处理便宜稳定。常混合：批特征打底 + 少量关键实时特征，避免为所有特征上昂贵的流式管道。

什么是特征商店？在 MLOps 中为何重要？

核心要点

简要回答

标准回答

常见误区

追问

延伸学习