开源项目2026-06-03·Google DeepMind

Google 发布 Gemma 4 12B：可在笔记本本地运行的多模态开源模型

Google DeepMind 于 6 月 3 日发布 Gemma 4 12B，11.95B 参数，256K 上下文，支持文本/图像/音频/视频。采用创新的无编码器架构，直接在 LLM 中处理多模态数据。仅需 16GB VRAM 即可本地运行，在 AIME、GPQA、LiveCode 等基准上大幅超越前代 E4B。Apache 2.0 许可证。

AI Master 解读

核心事件

Google 发布 Gemma 4 12B，11.95B 参数可在笔记本本地运行，首次实现中型模型多模态统一架构。

行业影响

传统多模态模型需要单独的 Vision Transformer 和音频编码器。Gemma 4 12B 采用单一 decoder-only transformer，通过 35M 参数视觉嵌入器和音频波投影直接将原始数据投射到 LLM 隐藏空间。

AI Master 建议

最实用的本地多模态选择。QAT 量化版本可进一步降低 72% 内存。

Gemma 4 12B：本地多模态智能

2026 年 6 月 3 日，Google DeepMind 发布 Gemma 4 12B。

核心规格

参数: 11.95B | 上下文: 256K token
多模态: 文本、图像、音频、视频
架构: 统一 decoder-only，无独立编码器
内存: 16GB VRAM | 许可证: Apache 2.0

性能对比（vs E4B）


基准	12B	E4B	提升
AIME	78.8	50	+57%
GPQA Diamond	75	25	+200%
LiveCode Bench	77.2	43.4	+78%

QAT 量化版（6/5）

内存降低 72%，12B 约 7GB VRAM
部署: Ollama / LM Studio / vLLM / HuggingFace

来源: Google DeepMind + InfoQ
链接: https://ai.google.dev/gemma/docs

📰 原始来源

https://ai.google.dev/gemma/docs

← 上一篇

SpaceX 寻求 750 亿美元 IPO：史上最大上市，估值 1.77 万亿美元

联合国报告：AI 碳排放、耗水量和土地足迹正在威胁数十亿人的自然资源

📰 更多动态

Agent2026-06-14