开源项目2026-06-03·Google DeepMind

Google 发布 Gemma 4 12B:可在笔记本本地运行的多模态开源模型

Google DeepMind 于 6 月 3 日发布 Gemma 4 12B,11.95B 参数,256K 上下文,支持文本/图像/音频/视频。采用创新的无编码器架构,直接在 LLM 中处理多模态数据。仅需 16GB VRAM 即可本地运行,在 AIME、GPQA、LiveCode 等基准上大幅超越前代 E4B。Apache 2.0 许可证。

AI Master 解读

核心事件

Google 发布 Gemma 4 12B,11.95B 参数可在笔记本本地运行,首次实现中型模型多模态统一架构。

行业影响

传统多模态模型需要单独的 Vision Transformer 和音频编码器。Gemma 4 12B 采用单一 decoder-only transformer,通过 35M 参数视觉嵌入器和音频波投影直接将原始数据投射到 LLM 隐藏空间。

AI Master 建议

最实用的本地多模态选择。QAT 量化版本可进一步降低 72% 内存。

Gemma 4 12B:本地多模态智能

2026 年 6 月 3 日,Google DeepMind 发布 Gemma 4 12B。

核心规格

  • 参数: 11.95B | 上下文: 256K token
  • 多模态: 文本、图像、音频、视频
  • 架构: 统一 decoder-only,无独立编码器
  • 内存: 16GB VRAM | 许可证: Apache 2.0

性能对比(vs E4B)

基准 12B E4B 提升
AIME 78.8 50 +57%
GPQA Diamond 75 25 +200%
LiveCode Bench 77.2 43.4 +78%

QAT 量化版(6/5)

  • 内存降低 72%,12B 约 7GB VRAM
  • 部署: Ollama / LM Studio / vLLM / HuggingFace

来源: Google DeepMind + InfoQ
链接: https://ai.google.dev/gemma/docs