← 首页/AI 资讯

大语言模型2026-05-14 20:00·量子位

字节跳动提出视觉生成第三种路线：让模型像人类一样"边画边改"

字节跳动研究团队提出全新视觉生成范式，挑战当前扩散模型和自回归模型的主导地位，让 AI 模型能够在生成过程中动态修改和调整。

视觉生成新范式：从"一次性生成"到"迭代式创作"

2026 年 5 月 14 日，量子位报道。

技术突破

第三种路线：不同于当前的扩散模型和自回归模型，新方法允许模型在生成过程中迭代修正
类人创作：模仿人类画家的"边画边改"工作方式
质量提升：在多个视觉生成基准上展现出更好的细节控制和一致性

行业影响

当前 AI 图像生成主要由扩散模型（如 Stable Diffusion）和自回归模型主导。字节提出的新路线如果验证有效，可能为视觉生成领域开辟新的技术方向。

来源： 量子位
链接： https://www.qbitai.com/

📰 原始来源

https://www.qbitai.com/

← 上一篇

微软 Edge Copilot 更新：AI 可跨标签页提取信息，打造个人软件新体验

下一篇 →

量子位热文："重生之我在 AI 时代当老板"——让一群 Agent 互相 PUA

📰 更多动态

行业2026-05-13 04:00

世界银行发布 2026 年世界发展报告：AI 正在重塑全球发展格局

行业2026-05-13 04:00

OpenAI 和 Anthropic 主导 2026 AI 竞赛：模型、企业与算力全面领先

安全2026-05-13 04:00

Google Chrome 被曝静默下载 4GB AI 模型到用户设备：未经同意，涉嫌违法