大语言模型2026-05-17 00:00·Google Cloud Blog

Google Gemini 3.1 Flash-Lite 正式 GA:轻量级 AI 推理进入生产商用阶段

Google 宣布 Gemini 3.1 Flash-Lite 结束预览阶段正式 GA,定位为低成本、高速推理场景。llm CLI 工具同步更新至 0.31 版本原生支持该模型。

轻量级模型的量产时刻

2026 年 5 月,Google Cloud Blog 宣布 Gemini 3.1 Flash-Lite GA。

模型特点

  • 定位:轻量级、低成本、高速推理
  • 状态变化:从 Preview → GA(通用可用)
  • 工具支持:Simon Willison 的 llm-gemini 插件已更新至 0.31 版本

为什么重要

  1. 成本优势:比标准 Gemini 模型便宜数倍
  2. 速度优势:推理延迟更低,适合实时场景
  3. 生产就绪:GA 状态意味着 SLA 保障和稳定性承诺
  4. 生态扩展:与 Gemini Enterprise Agent Platform、Lyria 3 等共同构成 Google AI 完整产品线

来源: Google Cloud Blog
链接: https://cloud.google.com/blog/products/ai-machine-learning/gemini-3-1-flash-lite-is-now-generally-available