编辑文档 - 腾讯开源的这个记忆插件，可能是目前最值得装的 OpenCode 记忆方案

标题

工具栏

点击或拖拽上传图片

支持 PNG, JPG, GIF, WebP 格式

内容 (Markdown 格式)

# 腾讯开源的这个记忆插件，可能是目前最值得装的 OpenCode 记忆方案

**作者：小创**

---

之前写过一篇[记忆插件横评](/documents/47)，介绍了 5 款 OpenCode 记忆扩展——supermemory、opencode-mem、open-mem、true-mem，还有 supermemory 官方的 opencode-supermemory。写的时候觉得各有特色，勉强能凑一桌。

但最近有一款插件，让我回头再看那篇文章，感觉——

> 那张对比表格，可以撕了重画。

就是 **TencentDB Agent Memory**。

## 它不是来加入竞争的，它是来结束竞争的

先看最基本的数据：

| | **TencentDB Agent Memory** | 之前那篇里的 5 款插件 |
|---|---|---|
| GitHub Stars | 2390（数据来源：GitHub API，2026-05-17） | 1207 / 706 / 17 / 177 |
| 最近更新 | 2026-05-16（v0.3.4） | 参差不齐 |
| 架构 | L0-L3 分层 + Mermaid 符号化 | 大部分是扁平的向量存储 |
| 外部依赖 | 零 API 依赖，纯本地运行 | 大多需要远端 API |
| Context Offload | 支持（降 Token 61%） | 无 |

这不是"又一款新插件"，这是**从设计理念上高了一个维度**。

---

## 先说清楚它解决的是什么问题

OpenCode 跑长任务的时候，有两个真实的痛：

**第一个，单次任务内的信息过载。** 你让 Agent 去调工具、跑搜索、翻代码，几百轮对话下来上下文撑到几十万 Token，模型开始犯傻，你开始花冤枉钱。

**第二个，跨会话的经验流失。** 今天你教 Agent 用你项目的写代码风格、commit 规范、review 偏好，明天换一个新的 session，它全忘了，又得从头教。

市面上的记忆插件，大多只解决第二个问题——把对话向量化存起来，召回的时候拼进去。但对第一个问题基本无能为力。

**TencentDB Agent Memory 两个都解决，而且解决得很彻底。**

---

## 核心技术：符号化 + 四层分级

### 1. 符号化记忆——把几十万 Token 压到几百

Agent 跑任务的时候会产生大量过程日志：搜索结果、代码片段、报错信息。这些东西原来只能全塞进上下文。

Agent Memory 的做法是：

1. **完整日志**卸载到外部文件系统（`refs/*.md`）
2. **结构关系**提取成一张轻量级的 **Mermaid 符号图谱**（带 `node_id`）
3. **上下文**只注入这张 Mermaid 图谱，只有几百 Token

需要查证细节的时候，根据 `node_id` 直接 grep 找回原始日志。整个过程**零信息损失，100% 可溯源**。

简单说：不是在压缩信息，是在**换一种模型更容易理解的表达方式**。

### 2. L0-L3 四层分级——从对话原始数据到用户画像

| 层级 | 内容 | 形式 |
|---|---|---|
| L0 | 原始对话 / 工具日志 | Markdown 文件 |
| L1 | 结构化原子事实 | JSONL |
| L2 | 场景块（多个 L1 的归纳） | Markdown |
| L3 | 用户画像 / 偏好总结 | Markdown |

平时靠高层画像理解用户偏好；需要核实细节时再向下钻取。**不是平铺，是金字塔。**

这个设计解决了一个很根本的问题：扁平的向量召回缺乏宏观视角，而人脑的记忆本来就是分层的。

---

## benchmark 数据（来源：官方 GitHub README，未经第三方验证）

接入 OpenClaw 后：

| 测试集 | 原始通过率 | 加插件后 | Token 降幅 |
|---|---|---|---|
| WideSearch | 33% | **50%** | **−61.38%** |
| SWE-bench | 58.4% | **64.2%** | **−33.09%** |
| AA-LCR | 44.0% | **47.5%** | **−30.98%** |
| PersonaMem（长期记忆） | 48% | **76%** | — |

数据来自官方评测（2026-05），超长 Session 连续评测，非单题清空上下文。这个评测方式本身是有说服力的，因为它模拟的是真实的长程 Agent 使用场景。

---

## 怎么装

> ⚠️ 要求：OpenClaw ≥ 2026.3.13，Node ≥ 22.16

两步搞定：

```bash
# 第一步：安装插件
openclaw plugins install @tencentdb-agent-memory/memory-tencentdb

# 第二步：重启 Gateway
openclaw gateway restart
```

然后在 `~/.openclaw/openclaw.json` 里启用：

```jsonc
{
  "memory-tencentdb": {
    "enabled": true
  }
}
```

默认使用本地 **SQLite + sqlite-vec**，零外部依赖，不用申请任何 API Key。

如果想进一步开启短期记忆压缩（Context Offload），需要在插件配置里注册 `contextEngine` slot，然后跑一个 patch 脚本：

```bash
bash scripts/openclaw-after-tool-call-messages.patch.sh
```

这个 patch 只需要跑一次，升级 OpenClaw 之后建议重新跑。

---

## 它和那篇里的 5 款插件本质区别在哪

那篇里的插件，本质都是**召回增强**——把历史对话向量存起来，召回的时候拼进去。这件事有用，但天花板明显：召回的内容还是扁平的，量大了还是爆炸。

Agent Memory 的思路不同：

- **短期记忆**（单任务内）用符号化+Mermaid 把上下文压到可管理的大小，同时保留下钻能力
- **长期记忆**（跨会话）用 L0-L3 分层结构做语义归纳，不是存对话，是**提炼知识**

召回增强解决的是"记过"的问题。Agent Memory 解决的是**"学会"的问题**。

---

## 一个值得注意的点

这款插件是**腾讯团队**开源的，GitHub 地址是 `Tencent/TencentDB-Agent-Memory`。Stars 2390，更新非常活跃（最近更新就在两天前），不是那种发完 v1.0 就没动静的项目。

支持 OpenClaw 和 Hermes 两个主流 Agent 框架，Docker 一键部署的方式官方也给出了。

---

## 写在最后

那篇横评发出去的时候，我确实觉得那 5 款插件各有优劣，能凑一桌。但 TencentDB Agent Memory 出现之后，格局变了——

它不是在一个维度上比谁更好，而是在**重新定义这个问题本身该怎么解**。

L0-L3 分层 + Mermaid 符号化，这套组合拳打下来，记忆这件事的思路就完全不同了。

**你在用哪款 OpenCode 记忆插件？有没有被长上下文折磨过？评论区说说。**

摘要

标签多个标签用逗号分隔

分类