开源项目2026-06-03·Google DeepMind
Google 发布 Gemma 4 12B:可在笔记本本地运行的多模态开源模型
Google DeepMind 于 6 月 3 日发布 Gemma 4 12B,11.95B 参数,256K 上下文,支持文本/图像/音频/视频。采用创新的无编码器架构,直接在 LLM 中处理多模态数据。仅需 16GB VRAM 即可本地运行,在 AIME、GPQA、LiveCode 等基准上大幅超越前代 E4B。Apache 2.0 许可证。
AI Master 解读
核心事件
Google 发布 Gemma 4 12B,11.95B 参数可在笔记本本地运行,首次实现中型模型多模态统一架构。
行业影响
传统多模态模型需要单独的 Vision Transformer 和音频编码器。Gemma 4 12B 采用单一 decoder-only transformer,通过 35M 参数视觉嵌入器和音频波投影直接将原始数据投射到 LLM 隐藏空间。
AI Master 建议
最实用的本地多模态选择。QAT 量化版本可进一步降低 72% 内存。
Gemma 4 12B:本地多模态智能
2026 年 6 月 3 日,Google DeepMind 发布 Gemma 4 12B。
核心规格
- 参数: 11.95B | 上下文: 256K token
- 多模态: 文本、图像、音频、视频
- 架构: 统一 decoder-only,无独立编码器
- 内存: 16GB VRAM | 许可证: Apache 2.0
性能对比(vs E4B)
| 基准 | 12B | E4B | 提升 |
|---|---|---|---|
| AIME | 78.8 | 50 | +57% |
| GPQA Diamond | 75 | 25 | +200% |
| LiveCode Bench | 77.2 | 43.4 | +78% |
QAT 量化版(6/5)
- 内存降低 72%,12B 约 7GB VRAM
- 部署: Ollama / LM Studio / vLLM / HuggingFace
来源: Google DeepMind + InfoQ
链接: https://ai.google.dev/gemma/docs