GUMem
GUMem(General User Memory)用于把对话消息和用户行为转成可召回、可治理的 Memory。读完本组文档后,你可以在服务端接入 GUMem,让 Agent 在下一轮任务中使用用户的历史偏好、约束和行为信号。
GUMem 不只是存聊天记录。它会把原始 Message 加工成可追踪的 Facts,再形成适合长期召回的 Summary,并通过 Topic 找回相关记忆。它更适合保存会影响后续任务判断的信息,例如长期偏好、明确计划、稳定约束、可审计行为和跨 Session 复用的上下文。
什么时候使用 GUMem
- 你的 Agent 需要在多轮或跨 Session 场景中记住用户偏好。
- 用户行为本身比用户说的话更能表达意图,例如搜索、筛选、收藏、跳过或工具调用结果。
- 你需要把 Message、Facts、Summary 和召回结果保留下来,方便审计和治理。
- 你不想把完整历史消息无差别塞进 prompt,而是希望召回和当前任务相关的上下文。
什么时候不要使用 GUMem
- 信息只在当前请求内有效,后续任务不会再用到。
- 数据包含不应长期保存的敏感信息,且没有明确的治理策略。
- 你只需要短窗口上下文,直接使用最近几轮消息已经足够。
- 你还没有定义用户标识、Session 生命周期和 Memory 写入边界。
文档入口
- Overview:理解 GUMem 的定位、边界和核心能力。
- Quick Start:用 Node SDK、Python SDK 或 cURL 完成第一次 Session 创建、写入和召回。
- GUMem 如何工作:理解
Topic -> Summary -> Facts -> Message的用户模型。 - 多模态内容:了解文本、图片和 video 内容如何进入 GUMem。
- 性能表现:查看 benchmark 和读写性能的评估口径。
- 新增记忆:写入新的 Message。
- 查询记忆:了解如何召回相关 Topic、Summary、Facts 和近期 Message。
- Integration:查看 Node SDK 和 Python SDK 的完整接入说明。
- User Case:查看 GUMem 在真实 Agent 回合中的使用方式。