📄 文档列表
🎬 口播文案
✏️ 编辑文档
标题
工具栏
加粗
H2 标题
H3 标题
引用
无序列表
有序列表
代码块
📷 上传图片
点击或拖拽上传图片
支持 PNG, JPG, GIF, WebP 格式
内容 (Markdown 格式)
## 一、Qwen3.7-Max:基准测试超Claude Opus,不只是"国产第一" 先说硬货。 Qwen3.7-Max在**GPQA Diamond**评测中得分**92.4**,Claude Opus-4.6得分是**91.3**。不是"接近",是直接超了。 Arena盲测也是国产第一。这个榜单的分量做AI的应该清楚——不是厂商自己填的表格,是真实用户盲投出来的。 但数字只是结果,核心问题是:**它怎么做到的?** 答案藏在下面这个案例里。 --- ## 二、35小时、1158次工具调用:国产AI第一次验证长程Agent生产级可行 这是今天最让我震撼的一条数据。 > Qwen3.7-Max在**从未见过**的真武M890芯片上,自主工作**35小时**、完成**1158次工具调用**,跑完了生产级内核优化,性能提升**10倍**。 注意几个关键词:**从未见过** + **生产级**。 这不是给它一个熟悉的环境让它跑分。这是扔给它一块全新的芯片,让它自己摸索、自己规划、自己执行——35小时,一个工具一个工具地调,最后交出结果。 这种能力,业内叫**长程Agent能力**。之前大家在说,但真正在国产模型上验证生产级可行,Qwen3.7-Max是第一次。 意味着什么?意味着以后真能让AI自主负责一个完整的生产任务,而不是"跑个demo给你看看"。 --- ## 三、千问云:首页没有控制台,只有一行npx指令 这是今天发布会的另一个重磅,但被大部分科技媒体低估了。 **千问云**——阿里云全新产品官网。 首页没有控制台。没有按钮、没有菜单、没有"登录即开始"。首页只有一行: ``` npx skills add ``` 一行指令,替代了整个控制台。 以前你想用云服务,要登录控制台、找菜单、点来点去、云架构图里找服务。 现在呢?你给AI一条指令,AI帮你读完文档、调用工具、执行任务、返回结果。 云的交互逻辑从**"人找功能"**变成了**"AI自动执行"**。 阿里云的判断是:**下一波云的主力消费者,不是人,是Agent。** --- ## 四、真武M890:144GB显存,性能是前代3倍 和Qwen3.7-Max配套发布的还有自研AI芯片**真武M890**。 规格:144GB显存,性能是前代**3倍**。配合128卡超节点服务器。 这块芯片不是配角——它就是上面那个35小时案例的硬件底座。Qwen3.7-Max能在"从未见过的芯片"上自主工作35小时,靠的就是这颗芯片和模型本身的强强联合。 --- ## 五、阿里云AI ARR超80亿:这不是PPT,是真金白银 最后说一个可能被忽略的数字。 阿里云AI的**ARR(年度 recurring revenue)已超80亿**,预计年底突破**300亿**。 ARR不是收入规模,是"订阅制收入"——意味着有稳定客户在持续付费,不是靠一锤子项目撑起来的数字。 300亿年底目标,意味着接下来大半年还有3倍多的增长空间。 这个数字背后,是Qwen3.7-Max和整个全栈Agent化战略的底气。 --- ## 写在最后 这波浪潮,核心就一句话:**未来云的用户不是人,是AI。** Qwen3.7-Max验证了国产模型长程Agent的生产级可行,千问云把"AI当用户"的交互逻辑变成了产品现实。 这不是某个功能的升级,是整个云服务交互范式的重构。 **你在用阿里云服务吗?觉得Agent化对日常开发影响大吗?评论区聊聊。** ---
摘要
标签
多个标签用逗号分隔
分类
技术文章
教程指南
工具测评
项目实战
行业观察
默认
💾 保存修改
← 返回查看
返回列表