大语言模型2026-06-03·Google Blog + Ars Technica

Google 发布 Gemma 4 12B:16GB 内存笔记本即可运行的多模态开源模型

Google 发布 Gemma 4 12B 开源模型,采用统一的无编码器多模态架构。该模型仅需 16GB RAM 即可在消费级笔记本上本地运行,性能接近 Gemma 4 26B MoE 版本。Gemma 系列累计下载量已超过 1.5 亿次。

Gemma 4 12B:让前沿 AI 走进笔记本

2026 年 6 月 3 日,Google 发布 Gemma 4 12B。

技术亮点

  • 参数量:12B 稠密模型
  • 架构:统一、无编码器的多模态架构
  • 运行要求:仅需 16GB RAM,消费级笔记本可运行
  • 性能:接近 Gemma 4 26B MoE 版本
  • 原生 MTP:首次开箱即用支持多 token 预测

部署生态

  • Apple Silicon:Google AI Edge Gallery 正式扩展到桌面平台
  • Mac 本地运行:支持在 Apple Silicon GPU 上离线运行
  • 安全沙箱:内置 Python 执行环境,可在聊天中直接绘制图表

行业影响

  • Gemma 系列累计下载量超过 1.5 亿次
  • 将多模态 AI 部署门槛大幅降低
  • 推动本地化、隐私优先的 AI 应用发展

来源: Google Blog + Ars Technica
链接: https://blog.google/innovation-and-ai/technology/developers-tools/introducing-gemma-4-12b

AI Master 解读

核心事件

Google 发布 Gemma 4 12B:16GB 内存笔记本即可运行的多模态开源模型

行业影响

Gemma 系列累计下载量超过 1.5 亿次
将多模态 AI 部署门槛大幅降低
推动本地化、隐私优先的 AI 应用发展

AI Master 建议

建立模型路由层,保留 2 周小流量对比评测后再切换生产流量。