编辑文档 - MiniMax M3 深度解读：1M 上下文、/usr/bin/bash.06/M 混合价格、超越 Opus 4.7 的 Coding 能力

标题

工具栏

点击或拖拽上传图片

支持 PNG, JPG, GIF, WebP 格式

内容 (Markdown 格式)

MiniMax 又发新模型了——这次叫 **M3**，定位是「Coding & Agentic Frontier」，1M 上下文，原生多模态。

官方说法是：「第一个把三项前沿能力统一在一个模型里的开源模型」。

数据看起来很猛，今天把关键信息整理出来。

---

## 一、M3 的核心参数

### 基础配置

| 参数 | 数值 | 说明 |
|------|------|------|
| **上下文窗口** | 1M tokens | API 支持，保证最低 512K |
| **处理速度** | 100 TPS | 比 Opus 快 3 倍 |
| **输入价格** | $0.30/M | API 直接调用 |
| **混合价格（含缓存）** | **$0.06/M** | 开启自动 Cache 后 |

$0.06/M 是什么概念？官方对比图显示，业界 SOTA（Opus 级别）平均 $0.9+/M——M3 便宜了 **15 倍**。

### 模型 ID（Pi Agent 可用）

Pi Agent 已支持 MiniMax M3，在 [pi.dev/models](https://pi.dev/models) 可以看到：

| 模型 ID | 上下文 | 输入价格 | 输出价格 |
|---------|--------|----------|----------|
| `MiniMax-M3` | 1M | $0.30/M | 缓存后 $0.06/M |

---

## 二、测试数据（来源：minimax.io 官方页面）

M3 的 benchmark 数据来自三个场景：

### 1. BrowseComp：超越 Opus 4.7

| 模型 | 得分 |
|------|------|
| **MiniMax M3** | **83.5** |
| Claude Opus 4.7 | 79.3 |

M3 在自主浏览和信息检索能力上超过了 Claude Opus 4.7。

### 2. SWE-bench：持平 Opus 4.7

| 测试 | M3 | Opus 4.7 |
|------|-----|----------|
| SWE-bench Pro | 与 Opus 持平 | 基准 |
| SWE-bench Verified | 与 Opus 持平 | 基准 |

### 3. PostTrainBench：自主训练排名第三

MiniMax 让 M3 在 12 小时内自主完成四个预训练模型的全流程——数据合成、训练、评测、迭代。

| 模型 | 得分 | 排名 |
|------|------|------|
| Opus 4.7 | 42.4 | #1 |
| GPT-5.5 | 39.3 | #2 |
| **MiniMax M3** | **37.1** | **#3** |

超过其他所有模型，包括 DeepSeek V4 等。

### 4. CUDA 优化：24 小时，9.4 倍加速

官方做了一次极端测试：让 M3 优化 NVIDIA Hopper GPU 上的 FP8 GEMM 内核。

从非可运行的 Triton 骨架代码开始，M3 连续跑了约 24 小时：
- 完成 **147 次 benchmark 提交**
- 硬件峰值利用率从 7.6% 提升到 **71.3%**
- 实现了 **9.4 倍加速**
- 全程无人工干预

---

## 三、三项核心能力

### 1. Coding & Agentic

M3 在软件工程、终端执行、多步推理等主流 benchmark 上达到世界领先水平。

强化学习优化的 Agent 编排能力，支持自适应任务分解和多步推理。相当于给 AI 发了一套完整的工具链——不只是写代码，还能规划、执行、调试。

### 2. 1M 上下文

官方把 1M 上下文定义为「基础设施」，不只是能力指标。

1M 上下文是长程 Agent 任务、长程 Coding、长视频理解的基础设施。API 保证最低 512K 可用上下文。

### 3. 原生多模态

M3 是原生多模态模型——整个数据流水线重建，训练数据扩展到 100T+，从零开始多模态训练，文本和视觉语义空间深度对齐。

不是后来加上去的视觉层，是模型的核心能力。

---

## 四、开源计划

M3 已在 API 上可用（api.minimax.io/v1/text/chatcompletion_v2），开源版本即将发布：

- **HuggingFace**：即将开源
- **GitHub**：即将开源
- **私有集群部署**：支持
- **微调**：支持

---

## 五、怎么接入？

### 1. API 调用（最简单）

```python
import requests

url = "https://api.minimax.io/v1/text/chatcompletion_v2"

payload = {
    "model": "MiniMax-M3",
    "messages": [
        {"role": "user", "content": "Hello"}
    ]
}
headers = {
    "Authorization": "Bearer <token>"
}

response = requests.post(url, json=payload, headers=headers)
print(response.text)
```

### 2. Pi Agent 直接使用

Pi 已支持 MiniMax M3，设置环境变量即可：

```powershell
$env:MINIMAX_API_KEY="xxxxxxxxxxxxxxxx"
```

然后：
```
/model MiniMax-M3
```

### 3. Token Plan（订阅制）

如果你用 Token Plan（订阅），M3 的能力自动生效，价格不变。

支持的 AI Coding 工具：
- Claude Code、Cursor、OpenCode、Codex CLI、Cline、Roocode、Kilo Code、TRAE、Grok CLI

### 4. MiniMax Code（网页 Agent）

不想写代码，可以直接用 [code.minimax.io](https://code.minimax.io)，基于 M3 的通用 Agent 平台，无需开发，直接体验 Coding Agent、多模态理解等能力。

---

## 六、和 DeepSeek V4 对比

既然都写到 MiniMax M3 了，顺便对比一下大家最关心的 DeepSeek V4：

| 对比项 | MiniMax M3 | DeepSeek V4 |
|------|------------|-------------|
| 上下文 | 1M | 1M |
| 输入价格 | $0.30/M | $0.14/M |
| 混合价格 | $0.06/M | - |
| 多模态 | ✅ 原生 | ❌ 文本为主 |
| SWE-bench | 持平 Opus 4.7 | 未公布 |
| PostTrainBench | 37.1 (#3) | - |
| 开源 | 即将 | ✅ |

**结论**：M3 在 Coding benchmark 上更占优，多模态能力更强；DeepSeek V4 价格更低，适合纯文本场景。

---

## 七、适合谁用？

| 场景 | 推荐 |
|------|------|
| 超长代码审查（>100K tokens） | M3（1M 上下文） |
| 多模态任务（代码+截图+文档） | M3（原生多模态） |
| 复杂 Agent 任务（多步规划） | M3（Coding & Agentic） |
| 预算有限、纯文本处理 | DeepSeek V4（$0.14/M） |
| 不想折腾、直接用 | Token Plan（订阅） |

摘要

标签多个标签用逗号分隔

分类