大语言模型2026-06-01·阿里巴巴通义千问
阿里巴巴发布 Qwen 3.7 Plus:多模态 Agent 模型,比 Max 便宜 6 倍
阿里巴巴于 6 月 1 日发布 Qwen 3.7 Plus,增加视觉和屏幕控制能力。同样支持 100 万上下文和 35 小时自主运行,价格仅 $0.40/$1.60 每百万 token。Vision Arena #16,SWE-Bench Pro ~60%。
AI Master 解读
核心事件
阿里巴巴发布 Qwen 3.7 Plus,增加视觉和屏幕控制能力,输入价格仅为 Max 的 1/6。
行业影响
多模态 Agent 模型的定价下探至 $0.40/M 输入,意味着视觉理解 + 自主操作的组合能力正在快速商品化。这对依赖 GUI 自动化的 RPA 场景和需要屏幕感知的长任务 Agent 影响尤为直接,可能加速替代传统 RPA 方案。
AI Master 建议
需要视觉理解的 Agent 场景首选,35 小时自主运行适合长时间后台任务。建议先在小流量场景对比 GPT-4o 和 Claude 的视觉 Agent 能力后再切换。
Qwen 3.7 Plus:多模态 Agent 模型
2026 年 6 月 1 日,阿里巴巴发布 Qwen 3.7 Plus。
与 Max 对比
| 特性 | Plus | Max |
|---|---|---|
| 模态 | 文本+图像+视频 | 仅文本 |
| 输入价格 | $0.40/M | $2.50/M |
| SWE-Bench Pro | ~60% | 60.6% |
| LM Arena 文本 | #15 | #13 |
核心能力
- 视觉 Agent + 计算机使用(屏幕控制/GUI 交互)
- 35 小时自主运行,1000+ 次工具调用
- 部署: 阿里云 / Fireworks AI / OpenRouter
来源: 阿里云计算 + Fireworks AI
链接: https://fireworks.ai/blog/qwen-3p7-plus