📄 文档列表
🎬 口播文案
✏️ 编辑文档
标题
工具栏
加粗
H2 标题
H3 标题
引用
无序列表
有序列表
代码块
📷 上传图片
点击或拖拽上传图片
支持 PNG, JPG, GIF, WebP 格式
内容 (Markdown 格式)
MiniMax 又发新模型了——这次叫 **M3**,定位是「Coding & Agentic Frontier」,1M 上下文,原生多模态。 官方说法是:「第一个把三项前沿能力统一在一个模型里的开源模型」。 数据看起来很猛,今天把关键信息整理出来。 --- ## 一、M3 的核心参数 ### 基础配置 | 参数 | 数值 | 说明 | |------|------|------| | **上下文窗口** | 1M tokens | API 支持,保证最低 512K | | **处理速度** | 100 TPS | 比 Opus 快 3 倍 | | **输入价格** | $0.30/M | API 直接调用 | | **混合价格(含缓存)** | **$0.06/M** | 开启自动 Cache 后 | $0.06/M 是什么概念?官方对比图显示,业界 SOTA(Opus 级别)平均 $0.9+/M——M3 便宜了 **15 倍**。 ### 模型 ID(Pi Agent 可用) Pi Agent 已支持 MiniMax M3,在 [pi.dev/models](https://pi.dev/models) 可以看到: | 模型 ID | 上下文 | 输入价格 | 输出价格 | |---------|--------|----------|----------| | `MiniMax-M3` | 1M | $0.30/M | 缓存后 $0.06/M | --- ## 二、测试数据(来源:minimax.io 官方页面) M3 的 benchmark 数据来自三个场景: ### 1. BrowseComp:超越 Opus 4.7 | 模型 | 得分 | |------|------| | **MiniMax M3** | **83.5** | | Claude Opus 4.7 | 79.3 | M3 在自主浏览和信息检索能力上超过了 Claude Opus 4.7。 ### 2. SWE-bench:持平 Opus 4.7 | 测试 | M3 | Opus 4.7 | |------|-----|----------| | SWE-bench Pro | 与 Opus 持平 | 基准 | | SWE-bench Verified | 与 Opus 持平 | 基准 | ### 3. PostTrainBench:自主训练排名第三 MiniMax 让 M3 在 12 小时内自主完成四个预训练模型的全流程——数据合成、训练、评测、迭代。 | 模型 | 得分 | 排名 | |------|------|------| | Opus 4.7 | 42.4 | #1 | | GPT-5.5 | 39.3 | #2 | | **MiniMax M3** | **37.1** | **#3** | 超过其他所有模型,包括 DeepSeek V4 等。 ### 4. CUDA 优化:24 小时,9.4 倍加速 官方做了一次极端测试:让 M3 优化 NVIDIA Hopper GPU 上的 FP8 GEMM 内核。 从非可运行的 Triton 骨架代码开始,M3 连续跑了约 24 小时: - 完成 **147 次 benchmark 提交** - 硬件峰值利用率从 7.6% 提升到 **71.3%** - 实现了 **9.4 倍加速** - 全程无人工干预 --- ## 三、三项核心能力 ### 1. Coding & Agentic M3 在软件工程、终端执行、多步推理等主流 benchmark 上达到世界领先水平。 强化学习优化的 Agent 编排能力,支持自适应任务分解和多步推理。相当于给 AI 发了一套完整的工具链——不只是写代码,还能规划、执行、调试。 ### 2. 1M 上下文 官方把 1M 上下文定义为「基础设施」,不只是能力指标。 1M 上下文是长程 Agent 任务、长程 Coding、长视频理解的基础设施。API 保证最低 512K 可用上下文。 ### 3. 原生多模态 M3 是原生多模态模型——整个数据流水线重建,训练数据扩展到 100T+,从零开始多模态训练,文本和视觉语义空间深度对齐。 不是后来加上去的视觉层,是模型的核心能力。 --- ## 四、开源计划 M3 已在 API 上可用(api.minimax.io/v1/text/chatcompletion_v2),开源版本即将发布: - **HuggingFace**:即将开源 - **GitHub**:即将开源 - **私有集群部署**:支持 - **微调**:支持 --- ## 五、怎么接入? ### 1. API 调用(最简单) ```python import requests url = "https://api.minimax.io/v1/text/chatcompletion_v2" payload = { "model": "MiniMax-M3", "messages": [ {"role": "user", "content": "Hello"} ] } headers = { "Authorization": "Bearer <token>" } response = requests.post(url, json=payload, headers=headers) print(response.text) ``` ### 2. Pi Agent 直接使用 Pi 已支持 MiniMax M3,设置环境变量即可: ```powershell $env:MINIMAX_API_KEY="xxxxxxxxxxxxxxxx" ``` 然后: ``` /model MiniMax-M3 ``` ### 3. Token Plan(订阅制) 如果你用 Token Plan(订阅),M3 的能力自动生效,价格不变。 支持的 AI Coding 工具: - Claude Code、Cursor、OpenCode、Codex CLI、Cline、Roocode、Kilo Code、TRAE、Grok CLI ### 4. MiniMax Code(网页 Agent) 不想写代码,可以直接用 [code.minimax.io](https://code.minimax.io),基于 M3 的通用 Agent 平台,无需开发,直接体验 Coding Agent、多模态理解等能力。 --- ## 六、和 DeepSeek V4 对比 既然都写到 MiniMax M3 了,顺便对比一下大家最关心的 DeepSeek V4: | 对比项 | MiniMax M3 | DeepSeek V4 | |------|------------|-------------| | 上下文 | 1M | 1M | | 输入价格 | $0.30/M | $0.14/M | | 混合价格 | $0.06/M | - | | 多模态 | ✅ 原生 | ❌ 文本为主 | | SWE-bench | 持平 Opus 4.7 | 未公布 | | PostTrainBench | 37.1 (#3) | - | | 开源 | 即将 | ✅ | **结论**:M3 在 Coding benchmark 上更占优,多模态能力更强;DeepSeek V4 价格更低,适合纯文本场景。 --- ## 七、适合谁用? | 场景 | 推荐 | |------|------| | 超长代码审查(>100K tokens) | M3(1M 上下文) | | 多模态任务(代码+截图+文档) | M3(原生多模态) | | 复杂 Agent 任务(多步规划) | M3(Coding & Agentic) | | 预算有限、纯文本处理 | DeepSeek V4($0.14/M) | | 不想折腾、直接用 | Token Plan(订阅) |
摘要
标签
多个标签用逗号分隔
分类
技术文章
教程指南
工具测评
项目实战
行业观察
默认
💾 保存修改
← 返回查看
返回列表