Overview
GUMem(General User Memory)是面向Agent的生产可用的记忆引擎。它接收对话消息和行为记录,抽取出后续任务可复用的 Memory,并在新的 Agent 回合中召回相关上下文。

核心特点
- 行为记忆与会话记忆融合分析:覆盖用户对话、工具调用、业务事件和行为记录,帮助 Agent 提取用户画像、偏好和意图。
- 长短记忆分层抽取:使用
ActionLogs/Messages->Facts->Summaries->Topics的记忆层次,在保留事实依据的同时提升长期记忆的信息密度。 - 超长对话记忆表现突出:在 LoCoMo benchmark 上取得 92.9% Judge 准确率,适合长会话、跨主题历史和时间相关记忆场景。
- 开发者友好:记忆数据支持用户自由管理,并且提供自定义 WebHooks 调整记忆生成、过滤和治理逻辑,使得开发者对记忆数据具备全面的掌控力。
最小接入链路
- 创建
Session,并把它绑定到你的业务用户标识。 - 在对话或行为发生后写入 Message。
- 在下一轮 Agent 响应前调用 Query Memory。
- 把返回的
formatted_context或结构化 Memory 放入模型上下文。 - 回复生成后,把新的用户消息和 assistant 回复写回 GUMem。
这条链路的顺序很重要:先召回,再生成,再写回。这样 Agent 使用的是进入本轮前已经沉淀的 Memory,而不是把当前回复误当作历史事实。
文档入口
- Quick Start:用 Node SDK、Python SDK 或 cURL 完成第一次接入。
- GUMem 如何工作:理解 Message、Facts、Summary 和 Topic 的关系。
- 多模态内容:了解文本、图片和 video 内容如何进入 GUMem。
- 新增记忆:写入新的 Message。
- 查询记忆:了解如何召回 Topic、Summary、Facts 和近期 Message。
- User Case:查看 GUMem 在典型 Agent 回合中的使用方式。