📄 文档列表
🎬 口播文案
✏️ 编辑文档
标题
工具栏
加粗
H2 标题
H3 标题
引用
无序列表
有序列表
代码块
📷 上传图片
点击或拖拽上传图片
支持 PNG, JPG, GIF, WebP 格式
内容 (Markdown 格式)
# 腾讯开源的这个记忆插件,可能是目前最值得装的 OpenCode 记忆方案 **作者:小创** --- 之前写过一篇[记忆插件横评](/documents/47),介绍了 5 款 OpenCode 记忆扩展——supermemory、opencode-mem、open-mem、true-mem,还有 supermemory 官方的 opencode-supermemory。写的时候觉得各有特色,勉强能凑一桌。 但最近有一款插件,让我回头再看那篇文章,感觉—— > 那张对比表格,可以撕了重画。 就是 **TencentDB Agent Memory**。 ## 它不是来加入竞争的,它是来结束竞争的 先看最基本的数据: | | **TencentDB Agent Memory** | 之前那篇里的 5 款插件 | |---|---|---| | GitHub Stars | 2390(数据来源:GitHub API,2026-05-17) | 1207 / 706 / 17 / 177 | | 最近更新 | 2026-05-16(v0.3.4) | 参差不齐 | | 架构 | L0-L3 分层 + Mermaid 符号化 | 大部分是扁平的向量存储 | | 外部依赖 | 零 API 依赖,纯本地运行 | 大多需要远端 API | | Context Offload | 支持(降 Token 61%) | 无 | 这不是"又一款新插件",这是**从设计理念上高了一个维度**。 --- ## 先说清楚它解决的是什么问题 OpenCode 跑长任务的时候,有两个真实的痛: **第一个,单次任务内的信息过载。** 你让 Agent 去调工具、跑搜索、翻代码,几百轮对话下来上下文撑到几十万 Token,模型开始犯傻,你开始花冤枉钱。 **第二个,跨会话的经验流失。** 今天你教 Agent 用你项目的写代码风格、commit 规范、review 偏好,明天换一个新的 session,它全忘了,又得从头教。 市面上的记忆插件,大多只解决第二个问题——把对话向量化存起来,召回的时候拼进去。但对第一个问题基本无能为力。 **TencentDB Agent Memory 两个都解决,而且解决得很彻底。** --- ## 核心技术:符号化 + 四层分级 ### 1. 符号化记忆——把几十万 Token 压到几百 Agent 跑任务的时候会产生大量过程日志:搜索结果、代码片段、报错信息。这些东西原来只能全塞进上下文。 Agent Memory 的做法是: 1. **完整日志**卸载到外部文件系统(`refs/*.md`) 2. **结构关系**提取成一张轻量级的 **Mermaid 符号图谱**(带 `node_id`) 3. **上下文**只注入这张 Mermaid 图谱,只有几百 Token 需要查证细节的时候,根据 `node_id` 直接 grep 找回原始日志。整个过程**零信息损失,100% 可溯源**。 简单说:不是在压缩信息,是在**换一种模型更容易理解的表达方式**。 ### 2. L0-L3 四层分级——从对话原始数据到用户画像 | 层级 | 内容 | 形式 | |---|---|---| | L0 | 原始对话 / 工具日志 | Markdown 文件 | | L1 | 结构化原子事实 | JSONL | | L2 | 场景块(多个 L1 的归纳) | Markdown | | L3 | 用户画像 / 偏好总结 | Markdown | 平时靠高层画像理解用户偏好;需要核实细节时再向下钻取。**不是平铺,是金字塔。** 这个设计解决了一个很根本的问题:扁平的向量召回缺乏宏观视角,而人脑的记忆本来就是分层的。 --- ## benchmark 数据(来源:官方 GitHub README,未经第三方验证) 接入 OpenClaw 后: | 测试集 | 原始通过率 | 加插件后 | Token 降幅 | |---|---|---|---| | WideSearch | 33% | **50%** | **−61.38%** | | SWE-bench | 58.4% | **64.2%** | **−33.09%** | | AA-LCR | 44.0% | **47.5%** | **−30.98%** | | PersonaMem(长期记忆) | 48% | **76%** | — | 数据来自官方评测(2026-05),超长 Session 连续评测,非单题清空上下文。这个评测方式本身是有说服力的,因为它模拟的是真实的长程 Agent 使用场景。 --- ## 怎么装 > ⚠️ 要求:OpenClaw ≥ 2026.3.13,Node ≥ 22.16 两步搞定: ```bash # 第一步:安装插件 openclaw plugins install @tencentdb-agent-memory/memory-tencentdb # 第二步:重启 Gateway openclaw gateway restart ``` 然后在 `~/.openclaw/openclaw.json` 里启用: ```jsonc { "memory-tencentdb": { "enabled": true } } ``` 默认使用本地 **SQLite + sqlite-vec**,零外部依赖,不用申请任何 API Key。 如果想进一步开启短期记忆压缩(Context Offload),需要在插件配置里注册 `contextEngine` slot,然后跑一个 patch 脚本: ```bash bash scripts/openclaw-after-tool-call-messages.patch.sh ``` 这个 patch 只需要跑一次,升级 OpenClaw 之后建议重新跑。 --- ## 它和那篇里的 5 款插件本质区别在哪 那篇里的插件,本质都是**召回增强**——把历史对话向量存起来,召回的时候拼进去。这件事有用,但天花板明显:召回的内容还是扁平的,量大了还是爆炸。 Agent Memory 的思路不同: - **短期记忆**(单任务内)用符号化+Mermaid 把上下文压到可管理的大小,同时保留下钻能力 - **长期记忆**(跨会话)用 L0-L3 分层结构做语义归纳,不是存对话,是**提炼知识** 召回增强解决的是"记过"的问题。Agent Memory 解决的是**"学会"的问题**。 --- ## 一个值得注意的点 这款插件是**腾讯团队**开源的,GitHub 地址是 `Tencent/TencentDB-Agent-Memory`。Stars 2390,更新非常活跃(最近更新就在两天前),不是那种发完 v1.0 就没动静的项目。 支持 OpenClaw 和 Hermes 两个主流 Agent 框架,Docker 一键部署的方式官方也给出了。 --- ## 写在最后 那篇横评发出去的时候,我确实觉得那 5 款插件各有优劣,能凑一桌。但 TencentDB Agent Memory 出现之后,格局变了—— 它不是在一个维度上比谁更好,而是在**重新定义这个问题本身该怎么解**。 L0-L3 分层 + Mermaid 符号化,这套组合拳打下来,记忆这件事的思路就完全不同了。 **你在用哪款 OpenCode 记忆插件?有没有被长上下文折磨过?评论区说说。**
摘要
标签
多个标签用逗号分隔
分类
技术文章
教程指南
工具测评
项目实战
行业观察
默认
💾 保存修改
← 返回查看
返回列表