开源项目昨天·搜狐科技

谷歌开源DiffusionGemma:颠覆自回归范式,本地部署仅需18GB显存

谷歌DeepMind开源全新实验性模型DiffusionGemma,采用离散扩散技术颠覆传统自回归文本生成范式。模型支持单次并行生成256个Token,最高实现4倍生成提速。采用26B总参数、3.8B激活参数的MoE架构,量化后仅需18GB显存即可本地部署。模型采用Apache 2.0协议,已兼容vLLM、Unsloth等主流推理框架。

AI Master 解读

核心事件

谷歌开源扩散模型DiffusionGemma,颠覆传统文本生成方式。

行业影响

影响分析: 这是文本生成领域的范式级创新。扩散模型在图像生成中已证明优势,现在正式进入文本领域。18GB显存的低门槛让个人开发者也能参与。

AI Master 建议

关注扩散模型在文本生成中的潜力,这可能开启本地AI应用的新纪元。

DiffusionGemma:文本生成的范式革命

谷歌DeepMind开源实验性模型DiffusionGemma。

技术突破:

  • 颠覆自回归生成范式,采用离散扩散技术
  • 单次并行生成256个Token
  • 最高4倍生成提速
  • 26B总参数、3.8B激活参数(MoE架构)
  • 量化后仅需18GB显存本地部署

开源生态:

  • Apache 2.0协议,可商用
  • 兼容vLLM、Unsloth等主流框架
  • 原生支持文本、图像、长视频多模态输入
  • 内置逻辑推演思考模式

适用场景:

  • 单用户本地运行
  • 低延迟智能体开发
  • 实时人机交互