大语言模型2026-05-14 20:00·量子位

字节跳动提出视觉生成第三种路线:让模型像人类一样"边画边改"

字节跳动研究团队提出全新视觉生成范式,挑战当前扩散模型和自回归模型的主导地位,让 AI 模型能够在生成过程中动态修改和调整。

视觉生成新范式:从"一次性生成"到"迭代式创作"

2026 年 5 月 14 日,量子位报道。

技术突破

  • 第三种路线:不同于当前的扩散模型和自回归模型,新方法允许模型在生成过程中迭代修正
  • 类人创作:模仿人类画家的"边画边改"工作方式
  • 质量提升:在多个视觉生成基准上展现出更好的细节控制和一致性

行业影响

当前 AI 图像生成主要由扩散模型(如 Stable Diffusion)和自回归模型主导。字节提出的新路线如果验证有效,可能为视觉生成领域开辟新的技术方向。

来源: 量子位
链接: https://www.qbitai.com/

📰 原始来源

https://www.qbitai.com/