大语言模型2 天前·凤凰网科技 + 软盟资讯

阿里发布 Qwen3.7-Plus:多模态智能体模型,Vision Arena 全球前五中国第一

阿里巴巴通义实验室发布 Qwen3.7-Plus 多模态智能体模型,在 Qwen3.7 基础上深度融合视觉能力,实现 GUI 操作、CLI 调用、代码生成与自我验证的端到端闭环。Hybrid-Agent 系统可连续自主运行 11 小时以上,无人工干预完成完整 APP 开发。

Qwen3.7-Plus:从“能看图说话”到“能看图做事”

2026 年 6 月 2 日,阿里 Qwen 团队正式发布 Qwen3.7-Plus。

核心突破

  • 视觉理解与语言推理统一到同一模型中
  • 面向多模态智能体场景,支持 GUI 操作、CLI 调用、代码生成与自我验证
  • Vision Arena 全球榜单中跻身前五、中国第一

实测表现

  • Hybrid-Agent 系统可连续自主运行 11 小时以上
  • 调用工具超 1000 次,生成超 10000 行代码
  • 在无人工干预情况下完成完整 APP 的全流程开发

战略意义

  • 多模态模型从“能看图说话”向“能看图做事”的关键跃迁
  • 视觉理解 + GUI 操作 + CLI 交互的统一,是走向通用计算机使用智能体的关键一步
  • 已通过阿里云百炼和 Qwen Studio 对外开放

来源: 凤凰网科技 + 软盟资讯
链接: https://news.softunis.com/60361.html