工作空间记忆研究
目标:Clawd 风格的工作空间 (agents.defaults.workspace,默认 ~/.openclaw/workspace),其中“记忆”以每天一个 Markdown 文件 (memory/YYYY-MM-DD.md) 加上一小部分稳定文件(例如 memory.md、SOUL.md)的形式存储。本文档提出一种离线优先的记忆架构,该架构保留 Markdown 作为规范、可审查的事实来源,但通过派生索引增加结构化回忆(搜索、实体摘要、置信度更新)。
为何改变?
当前的设置(每天一个文件)非常适合:
- “仅追加”式日志记录
- 人工编辑
- git 支持的持久性和可审计性
- 低摩擦捕获(“只需写下来”)
它在以下方面较弱:
- 高召回率检索(“我们关于 X 的决定是什么?”、“上次我们尝试 Y 是什么时候?”)
- 以实体为中心的答案(“告诉我关于 Alice / The Castle / warelay 的信息”)而无需重读许多文件
- 观点/偏好的稳定性(以及其变化时的证据)
- 时间约束(“2025年11月期间什么是真的?”)和冲突解决
设计目标
- 离线:无需网络即可工作;可在笔记本电脑/Castle 上运行;无云依赖。
- 可解释:检索到的项目应可归因(文件+位置)且可与推理分离。
- 低仪式感:日常日志记录保持 Markdown 格式,无需繁重的模式工作。
- 渐进式:仅使用 FTS 的 v1 版本就很有用;语义/向量和图是可选的升级项。
- 智能体友好:使“在令牌预算内回忆”变得容易(返回少量事实包)。
北极星模型 (Hindsight × Letta)
需要融合的两个部分:
- Letta/MemGPT 风格的控制循环
- 在上下文中始终保留一个小的“核心”(角色+关键用户事实)
- 其他所有内容都置于上下文之外,通过工具检索
- 记忆写入是显式的工具调用(追加/替换/插入),持久化后在下一次交互中重新注入
- Hindsight 风格的记忆基底
- 区分观察到的事实、相信的事实和总结的事实
- 支持保留/回忆/反思
- 带有置信度的观点,可随证据演变
- 实体感知检索 + 时间查询(即使没有完整的知识图谱)
提议的架构(Markdown 事实来源 + 派生索引)
规范存储(git 友好)
保持 ~/.openclaw/workspace 作为规范的人类可读记忆。建议的工作空间布局:
~/.openclaw/workspace/
memory.md # 小型:持久事实 + 偏好(核心性质)
memory/
YYYY-MM-DD.md # 每日日志(追加;叙述性)
bank/ # “类型化”记忆页面(稳定,可审查)
world.md # 关于世界的客观事实
experience.md # 智能体所做的事情(第一人称)
opinions.md # 主观偏好/判断 + 置信度 + 证据指针
entities/
Peter.md
The-Castle.md
warelay.md
...
说明:
- 每日日志保持为每日日志。无需将其转换为 JSON。
bank/中的文件是经过整理的,由反思作业生成,并且仍然可以手动编辑。memory.md保持“小型 + 核心性质”:你希望 Clawd 在每个会话中看到的内容。
派生存储(机器回忆)
在工作空间下添加一个派生索引(不一定需要 git 跟踪):
~/.openclaw/workspace/.memory/index.sqlite
支持:
- 用于事实 + 实体链接 + 观点元数据的 SQLite 模式
- 用于词汇回忆的 SQLite FTS5(快速、小巧、离线)
- 用于语义回忆的可选嵌入表(仍为离线)
索引始终可以从 Markdown 重建。
保留 / 回忆 / 反思(操作循环)
保留:将每日日志规范化为“事实”
Hindsight 在此相关的关键见解:存储叙述性、自包含的事实,而非微小的片段。对于 memory/YYYY-MM-DD.md 的实用规则:
- 在一天结束时(或期间),添加一个
## Retain部分,包含 2–5 个要点,这些要点:- 是叙述性的(保留跨轮次上下文)
- 是自包含的(以后能独立理解)
- 带有类型标签和实体提及
示例:
## Retain
- W @Peter: Currently in Marrakech (Nov 27–Dec 1, 2025) for Andy’s birthday.
- B @warelay: I fixed the Baileys WS crash by wrapping connection.update handlers in try/catch (see memory/2025-11-27.md).
- O(c=0.95) @Peter: Prefers concise replies (<1500 chars) on WhatsApp; long content goes into files.
最小化解析:
- 类型前缀:
W(世界),B(经历/传记),O(观点),S(观察/总结;通常由生成) - 实体:
@Peter,@warelay, 等(slug 映射到bank/entities/*.md) - 观点置信度:
O(c=0.0..1.0)可选
如果你不希望作者考虑这些:反思作业可以从日志的其余部分推断出这些要点,但拥有显式的 ## Retain 部分是最简单的“质量杠杆”。
回忆:对派生索引进行查询
回忆应支持:
- 词汇:“查找确切的术语/名称/命令”(FTS5)
- 实体:“告诉我关于 X 的信息”(实体页面 + 实体链接的事实)
- 时间:“11月27日前后发生了什么”/“自上周以来”
- 观点:“Peter 偏好什么?”(附带置信度 + 证据)
返回格式应智能体友好并引用来源:
kind(world|experience|opinion|observation)timestamp(来源日期,或如果存在则提取的时间范围)entities(["Peter","warelay"])content(叙述性事实)source(memory/2025-11-27.md#L12等)
反思:生成稳定页面 + 更新信念
反思是一个定时作业(每日或心跳 ultrathink),它:
- 根据近期事实更新
bank/entities/*.md(实体摘要) - 根据强化/矛盾更新
bank/opinions.md的置信度 - 可选地提议对
memory.md进行编辑(“核心性质”的持久事实)
观点演化(简单,可解释):
- 每个观点包含:
- 陈述
- 置信度
c ∈ [0,1] - 最后更新时间
- 证据链接(支持 + 矛盾的事实 ID)
- 当新事实到达时:
- 通过实体重叠 + 相似性(先 FTS,后嵌入)找到候选观点
- 通过小的增量更新置信度;大的跳跃需要强烈的矛盾 + 重复的证据
CLI 集成:独立 vs 深度集成
建议:深度集成到 OpenClaw 中,但保留一个可分离的核心库。
为何集成到 OpenClaw?
- OpenClaw 已经知道:
- 工作空间路径 (
agents.defaults.workspace) - 会话模型 + 心跳
- 日志记录 + 故障排除模式
- 工作空间路径 (
- 你希望智能体本身调用工具:
openclaw memory recall "…" --k 25 --since 30dopenclaw memory reflect --since 7d
为何仍要拆分一个库?
- 保持记忆逻辑无需网关/运行时即可测试
- 在其他上下文中重用(本地脚本、未来的桌面应用等)
形态:记忆工具旨在成为一个小的 CLI + 库层,但这仅是探索性的。
“S-Collide” / SuCo:何时使用它(研究)
如果“S-Collide”指的是 SuCo (Subspace Collision):它是一种 ANN 检索方法,通过使用子空间中的学习/结构化碰撞来瞄准强召回率/延迟权衡(论文:arXiv 2411.14754, 2024)。对于 ~/.openclaw/workspace 的实用建议:
- 不要从 SuCo 开始。
- 从 SQLite FTS +(可选的)简单嵌入开始;你将立即获得大部分用户体验提升。
- 仅在以下情况下考虑 SuCo/HNSW/ScaNN 类解决方案:
- 语料库很大(数万/数十万个块)
- 暴力嵌入搜索变得太慢
- 召回质量受到词汇搜索的显著瓶颈
离线友好的替代方案(按复杂度递增):
- SQLite FTS5 + 元数据过滤器(零机器学习)
- 嵌入 + 暴力搜索(如果块数量少,效果出奇地好)
- HNSW 索引(常见,稳健;需要一个库绑定)
- SuCo(研究级;如果有可以嵌入的可靠实现,则很有吸引力)
开放性问题:
- 对于你机器(笔记本电脑 + 台式机)上的“个人助理记忆”,最佳的离线嵌入模型是什么?
- 如果你已经有 Ollama:使用本地模型嵌入;否则在工具链中附带一个小型嵌入模型。
最小可用试点
如果你想要一个最小但仍可用的版本:
- 添加
bank/实体页面和每日日志中的## Retain部分。 - 使用 SQLite FTS 进行带引用的回忆(路径 + 行号)。
- 仅在召回质量或规模需要时才添加嵌入。
参考文献
- Letta / MemGPT 概念:“核心记忆块” + “归档记忆” + 工具驱动的自我编辑记忆。
- Hindsight 技术报告:“保留 / 回忆 / 反思”,四网络记忆,叙述性事实提取,观点置信度演化。
- SuCo:arXiv 2411.14754 (2024):“子空间碰撞”近似最近邻检索。