视觉生成的第三条路
2026 年 5 月 13 日,字节跳动团队发布了一种全新的视觉生成方法。
技术突破
- 现有路线:当前 AI 图像生成主要依赖扩散模型(Stable Diffusion、DALL-E)和自回归模型(部分 VLM)
- 新方法:支持「边画边改」的迭代生成模式,更接近人类画家的创作流程
- 核心优势:可以在生成过程中接收反馈并实时修正
行业意义
扩散模型和自回归模型统治视觉生成领域多年,字节跳动的第三种路线如果能在质量和速度上达到同等水平,将显著改变 AI 图像生成的技术格局。
来源: 量子位
链接: https://www.qbitai.com/
📰 原始来源
https://www.qbitai.com/