大语言模型2026-06-01·阿里巴巴通义千问

阿里巴巴发布 Qwen 3.7 Plus:多模态 Agent 模型,比 Max 便宜 6 倍

阿里巴巴于 6 月 1 日发布 Qwen 3.7 Plus,增加视觉和屏幕控制能力。同样支持 100 万上下文和 35 小时自主运行,价格仅 $0.40/$1.60 每百万 token。Vision Arena #16,SWE-Bench Pro ~60%。

AI Master 解读

核心事件

阿里巴巴发布 Qwen 3.7 Plus,增加视觉和屏幕控制能力,输入价格仅为 Max 的 1/6。

行业影响

多模态 Agent 模型的定价下探至 $0.40/M 输入,意味着视觉理解 + 自主操作的组合能力正在快速商品化。这对依赖 GUI 自动化的 RPA 场景和需要屏幕感知的长任务 Agent 影响尤为直接,可能加速替代传统 RPA 方案。

AI Master 建议

需要视觉理解的 Agent 场景首选,35 小时自主运行适合长时间后台任务。建议先在小流量场景对比 GPT-4o 和 Claude 的视觉 Agent 能力后再切换。

Qwen 3.7 Plus:多模态 Agent 模型

2026 年 6 月 1 日,阿里巴巴发布 Qwen 3.7 Plus。

与 Max 对比

特性 Plus Max
模态 文本+图像+视频 仅文本
输入价格 $0.40/M $2.50/M
SWE-Bench Pro ~60% 60.6%
LM Arena 文本 #15 #13

核心能力

  • 视觉 Agent + 计算机使用(屏幕控制/GUI 交互)
  • 35 小时自主运行,1000+ 次工具调用
  • 部署: 阿里云 / Fireworks AI / OpenRouter

来源: 阿里云计算 + Fireworks AI
链接: https://fireworks.ai/blog/qwen-3p7-plus