大语言模型2 天前·凤凰网 + 36氪

谷歌开源扩散模型新作,每秒狂吐 1000 token,4090 单卡可跑

凤凰网报道谷歌开源了新的扩散语言模型,生成速度达到每秒 1000 token,且可在单张 RTX 4090 上运行。这是扩散模型在文本生成领域的又一重大突破。

AI Master 解读

核心事件

谷歌开源高性能扩散语言模型

行业影响

关键特性
生成速度每秒 1000 token
单张 RTX 4090 即可运行
扩散模型在文本生成领域持续突破

AI Master 建议

扩散语言模型可能在某些场景替代自回归模型,值得关注其生成质量和可控性。

谷歌开源高性能扩散语言模型

2026 年 6 月 11 日,凤凰网 + 36 氪报道。

核心特性

  • 新扩散模型生成速度达到每秒 1000 token
  • 可在单张 RTX 4090 上运行,推理门槛大幅降低
  • 这是扩散模型在文本生成领域的又一重大进展

技术背景

  • 扩散语言模型正在成为自回归模型的重要替代方案
  • 36 氪此前报道过"用扩散模型生成文本"的技术趋势
  • arXiv 近期也有多篇论文探讨 Beyond Fully Random Masking 的扩散语言模型优化

来源: 凤凰网 + 36 氪
链接: https://tech.ifeng.com/c/8ts5P9i3CK2