开源模型基础设施的春天
2026 年 6 月 5 日,Ramp 报告揭示企业 AI 支出范式转变。
快速增长的推理服务商
- Fireworks AI: 开源模型 API 调用平台
- fal AI: 快速推理服务
- DeepInfra: 开源模型部署平台
企业多模型策略
- 旗舰模型: OpenAI/Anthropic 处理最复杂任务
- 日常任务: 转向更经济的开源模型替代方案
- 开源份额: 企业 Token 用量中开源/开放权重模型占 38%(去年同期仅 11%)
- 中位数部署: 企业生产环境同时部署 14 个模型
行业趋势
这一转变意味着 AI 基础设施正在从单一供应商依赖走向多供应商、多模型并存的生态格局。模型本身正在快速商品化,而模型的调度、路由和成本管理成为新的竞争焦点。
来源: Ramp + AI.cc + Andreessen Horowitz
链接: https://finance.sina.com.cn/tech/roll/2026-06-05/doc-iniaicuw3033537.shtml