开源项目昨天·搜狐科技
谷歌开源DiffusionGemma:颠覆自回归范式,本地部署仅需18GB显存
谷歌DeepMind开源全新实验性模型DiffusionGemma,采用离散扩散技术颠覆传统自回归文本生成范式。模型支持单次并行生成256个Token,最高实现4倍生成提速。采用26B总参数、3.8B激活参数的MoE架构,量化后仅需18GB显存即可本地部署。模型采用Apache 2.0协议,已兼容vLLM、Unsloth等主流推理框架。
AI Master 解读
核心事件
谷歌开源扩散模型DiffusionGemma,颠覆传统文本生成方式。
行业影响
影响分析: 这是文本生成领域的范式级创新。扩散模型在图像生成中已证明优势,现在正式进入文本领域。18GB显存的低门槛让个人开发者也能参与。
AI Master 建议
关注扩散模型在文本生成中的潜力,这可能开启本地AI应用的新纪元。
DiffusionGemma:文本生成的范式革命
谷歌DeepMind开源实验性模型DiffusionGemma。
技术突破:
- 颠覆自回归生成范式,采用离散扩散技术
- 单次并行生成256个Token
- 最高4倍生成提速
- 26B总参数、3.8B激活参数(MoE架构)
- 量化后仅需18GB显存本地部署
开源生态:
- Apache 2.0协议,可商用
- 兼容vLLM、Unsloth等主流框架
- 原生支持文本、图像、长视频多模态输入
- 内置逻辑推演思考模式
适用场景:
- 单用户本地运行
- 低延迟智能体开发
- 实时人机交互