📖 产品简介
Qwen3.7-Plus 是阿里巴巴通义实验室 2026 年 6 月 2 日凌晨正式发布的多模态智能体旗舰模型,在 Qwen3.7 文本与 Agent 基础上深度融合视觉能力,主打'能看、能想、能动手'。模型在全球视觉大模型榜单 Vision Arena 上跻身全球前五、国内第一。
它的真正杀手锏是端到端的'多模态 Agent'闭环:可解析图像/视频/屏幕/网页,自主在 GUI 与 CLI 双端执行任务。官方实测数据显示,模型可在 11 小时内无人干预地自主完成一个 APP 的全链路开发——从理解需求、设计 UI、写代码、调试、到打包部署。这是国产模型在'看-想-写-做-验'闭环上的首次完整公开示范。
模型已上架阿里云百炼平台对外提供 API 服务,企业可直接调用接入业务系统。
⚡ 核心功能
- 视觉-语言一体化:原生支持图像、视频、屏幕截图、网页输入,模型不再需要外挂 OCR/标注工具
- GUI + CLI 双端:既能像 Computer Use 一样操作图形界面,也能在终端执行命令,覆盖几乎所有数字工作场景
- 智能体编排能力:保持 Qwen3.7 在编码、工具使用、生产力工作流方面的完整 Agent 能力,新增视觉理解作为决策输入
- Vision Arena 全球前五:在权威多模态大模型评测榜中排名仅次于国际顶级闭源模型,国产第一
- 11 小时自主完成 APP 开发:官方公开实测:从需求到上线,全程无人干预、高保真还原 UI/UX
- 百炼平台 API 即用:已上架阿里云百炼,企业级调用门槛低,配合通义灵码可形成完整开发闭环
🎯 适合谁用
以下类型的用户会特别受益于 Qwen3.7-Plus:
- 全自动 APP / 小程序原型开发(理解设计稿 → 生成代码 → 自测)
- 桌面/网页 RPA 自动化(替代传统脚本式 RPA 的脆弱选择器)
- 复杂网页/PDF/技术图纸的视觉问答与信息抽取
- 企业知识库 + 多模态内容(含图表)的智能问答系统
✅ 优点亮点
- 国产模型首个公开'11 小时全自主 APP 开发'闭环示范,能力可验证
- Vision Arena 全球前五的视觉能力配合阿里云生态,落地路径清晰
- GUI + CLI 双端通吃,跨场景适应性强于纯 GUI 或纯 CLI 模型
- 百炼平台直接 API 调用,企业接入成本低
💰 价格与方案
通过阿里云百炼按 Token 计费,支持企业级 SLA。具体单价以百炼控制台公示为准。Qwen3.7 文本基座保持开源,Plus 多模态版本暂为闭源 API 形式。
📝 总结与建议
Qwen3.7-Plus 是国内目前最完整的'多模态 Agent'解决方案之一,把'看 - 想 - 写 - 做 - 验'统一在单一模型内,11 小时自主完成 APP 开发的实测让国产 Agent 能力第一次有了可信的公开锚点。适合需要视觉理解 + 自主执行结合的复杂场景:自动化测试、桌面 RPA、富媒体知识库等。如果你的工作流主要是文本对话,Qwen3.7-Max / Qwen3.7 文本版基座可能更经济;但只要任务里出现'屏幕、网页、图纸、UI'这类视觉输入,Plus 版本带来的能力跃迁是显著的。