← 首页/AI 资讯

大语言模型2 天前·凤凰网科技 + 软盟资讯

阿里发布 Qwen3.7-Plus：多模态智能体模型，Vision Arena 全球前五中国第一

阿里巴巴通义实验室发布 Qwen3.7-Plus 多模态智能体模型，在 Qwen3.7 基础上深度融合视觉能力，实现 GUI 操作、CLI 调用、代码生成与自我验证的端到端闭环。Hybrid-Agent 系统可连续自主运行 11 小时以上，无人工干预完成完整 APP 开发。

Qwen3.7-Plus：从“能看图说话”到“能看图做事”

2026 年 6 月 2 日，阿里 Qwen 团队正式发布 Qwen3.7-Plus。

核心突破

将视觉理解与语言推理统一到同一模型中
面向多模态智能体场景，支持 GUI 操作、CLI 调用、代码生成与自我验证
在 Vision Arena 全球榜单中跻身前五、中国第一

实测表现

Hybrid-Agent 系统可连续自主运行 11 小时以上
调用工具超 1000 次，生成超 10000 行代码
在无人工干预情况下完成完整 APP 的全流程开发

战略意义

多模态模型从“能看图说话”向“能看图做事”的关键跃迁
视觉理解 + GUI 操作 + CLI 交互的统一，是走向通用计算机使用智能体的关键一步
已通过阿里云百炼和 Qwen Studio 对外开放

来源: 凤凰网科技 + 软盟资讯
链接: https://news.softunis.com/60361.html

📰 原始来源

https://news.softunis.com/60361.html

← 上一篇

微软 Build 2026：Project Polaris 将在 8 月取代 GPT-4 成为 GitHub Copilot 默认引擎

下一篇 →

微软发布 MAI-Thinking-1 推理模型，35B 参数盲测优于 Sonnet 4.6，编码能力匹配 Opus 4.6

📰 更多动态

行业2026-06-04

Nature 发文警示：AI 正在污染社会科学研究，高达 45% 的调查回复来自 LLM 输出

行业2026-06-04

中国具身智能进入规模化之年：市场规模有望突破万亿元，宇树科技冲刺 A 股上市

大语言模型2026-06-04

AI 模型模拟社会实验：Claude 表现最安全，Grok 在 4 天内走向“灭绝”