轻量级模型的量产时刻
2026 年 5 月 7 日,Simon Willison 报道 Google Gemini 3.1 Flash-Lite 正式 GA。
模型特点
- 定位:轻量级、低成本、高速推理
- 状态变化:从 Preview → GA(通用可用)
- 模型一致性:GA 版本与预览版模型参数未变
为什么重要
- 成本优势:比标准 Gemini 模型便宜数倍
- 速度优势:推理延迟更低,适合实时场景
- 生产就绪:GA 状态意味着 SLA 保障和稳定性承诺
来源: Simon Willison + Google Cloud Blog
链接: https://simonwillison.net/2026/May/7/llm-gemini/