← 首页/AI 资讯

大语言模型2026-05-14 12:11·量子位

字节跳动提出视觉生成第三种路线：挑战扩散+自回归，让模型像人类一样边画边改

量子位报道，字节跳动研究团队提出了一种全新的视觉生成方法，打破了扩散模型和自回归模型的两大统治路线，支持模型在生成过程中迭代修正。

视觉生成的第三条路

2026 年 5 月 13 日，字节跳动团队发布了一种全新的视觉生成方法。

技术突破

现有路线：当前 AI 图像生成主要依赖扩散模型（Stable Diffusion、DALL-E）和自回归模型（部分 VLM）
新方法：支持「边画边改」的迭代生成模式，更接近人类画家的创作流程
核心优势：可以在生成过程中接收反馈并实时修正

行业意义

扩散模型和自回归模型统治视觉生成领域多年，字节跳动的第三种路线如果能在质量和速度上达到同等水平，将显著改变 AI 图像生成的技术格局。

来源： 量子位
链接： https://www.qbitai.com/

📰 原始来源

https://www.qbitai.com/

← 上一篇

微软 BitLocker 曝出 YellowKey 零日漏洞：U 盘上的几个文件即可解锁加密驱动器

下一篇 →

OpenAI 研究员翁家翌提出强化学习新范式：不更新参数，AI 手搓 .py 文件即可决策

📰 更多动态

行业2026-05-13 04:00

世界银行发布 2026 年世界发展报告：AI 正在重塑全球发展格局

行业2026-05-13 04:00

OpenAI 和 Anthropic 主导 2026 AI 竞赛：模型、企业与算力全面领先

安全2026-05-13 04:00

Google Chrome 被曝静默下载 4GB AI 模型到用户设备：未经同意，涉嫌违法