Metaflow (Netflix)
Netflix 开源的 AI/ML 系统构建与管理平台,简化从原型到生产的 ML 工作流。支持版本控制、依赖管理、计算资源调度和可复现性,是 Netflix 内部 ML 平台的核心
🎯适用场景:ML 模型训练流水线管理、从实验到生产的 ML 工作流编排
📊 仓库数据
✅ 优点
- •Netflix 内部验证的成熟度
- •简化 ML 从原型到生产的全流程
- •内置版本控制和依赖管理
- •支持 AWS/本地多种计算后端
⚠️ 限制
- •深度集成 AWS 生态
- •学习曲线比 Airflow 陡
- •文档以英文为主
🔗 相关工具
Keep
github.com/keephq/keep
开源 AIOps 和告警管理平台。通过 AI 驱动的事件关联和根因分析,帮助运维团队减少告警疲劳。支持整合多种监控工具(Prometheus、Datadog、PagerDuty 等)的告警到统一平台。
🎯AI 服务多源告警聚合、自动告警降噪、AIOps 工作流自动化
OmniRoute
github.com/diegosouzapw/OmniRoute
免费 AI 网关,单端点接入 160+ 提供商(50+ 免费),支持 Claude Code、Cursor 等工具的模型路由和限流。
🎯多模型聚合路由、免费 AI 服务集成
CozeLoop
github.com/coze-dev/coze-loop
字节跳动 Coze 团队出品的 AI Agent 优化平台,解决 Agent 开发中的调试、评测和优化难题。
🎯AI Agent 开发、调试与性能优化
Bifrost
github.com/maximhq/bifrost
企业级 AI 网关,比 LiteLLM 快 50 倍,支持自适应负载均衡、集群模式和 GPU 推理。
🎯高性能 AI 推理网关、模型路由与负载均衡
Embedding Atlas
github.com/apple/embedding-atlas
Apple 出品的 Embedding 交互式可视化工具,支持大规模 Embedding 的可视化、交叉过滤和元数据搜索。是理解和调试向量表示的强大工具
🎯Embedding 可视化分析与调试
Semantic Router
github.com/vllm-project/semantic-router
vLLM 项目出品的系统级智能路由器,在云、数据中心和边缘实现 Mixture-of-Models 的智能路由。
🎯多模型智能路由与混合模型部署