大语言模型2026-05-14 12:11·量子位

字节跳动提出视觉生成第三种路线:挑战扩散+自回归,让模型像人类一样边画边改

量子位报道,字节跳动研究团队提出了一种全新的视觉生成方法,打破了扩散模型和自回归模型的两大统治路线,支持模型在生成过程中迭代修正。

视觉生成的第三条路

2026 年 5 月 13 日,字节跳动团队发布了一种全新的视觉生成方法。

技术突破

  • 现有路线:当前 AI 图像生成主要依赖扩散模型(Stable Diffusion、DALL-E)和自回归模型(部分 VLM)
  • 新方法:支持「边画边改」的迭代生成模式,更接近人类画家的创作流程
  • 核心优势:可以在生成过程中接收反馈并实时修正

行业意义

扩散模型和自回归模型统治视觉生成领域多年,字节跳动的第三种路线如果能在质量和速度上达到同等水平,将显著改变 AI 图像生成的技术格局。

来源: 量子位
链接: https://www.qbitai.com/

📰 原始来源

https://www.qbitai.com/