Skip to content
Go to Dashboard

GUMem

GUMem(General User Memory)用于把对话消息和用户行为转成可召回、可治理的 Memory。读完本组文档后,你可以在服务端接入 GUMem,让 Agent 在下一轮任务中使用用户的历史偏好、约束和行为信号。

GUMem 不只是存聊天记录。它会把原始 Message 加工成可追踪的 Facts,再形成适合长期召回的 Summary,并通过 Topic 找回相关记忆。它更适合保存会影响后续任务判断的信息,例如长期偏好、明确计划、稳定约束、可审计行为和跨 Session 复用的上下文。

什么时候使用 GUMem

  • 你的 Agent 需要在多轮或跨 Session 场景中记住用户偏好。
  • 用户行为本身比用户说的话更能表达意图,例如搜索、筛选、收藏、跳过或工具调用结果。
  • 你需要把 Message、Facts、Summary 和召回结果保留下来,方便审计和治理。
  • 你不想把完整历史消息无差别塞进 prompt,而是希望召回和当前任务相关的上下文。

什么时候不要使用 GUMem

  • 信息只在当前请求内有效,后续任务不会再用到。
  • 数据包含不应长期保存的敏感信息,且没有明确的治理策略。
  • 你只需要短窗口上下文,直接使用最近几轮消息已经足够。
  • 你还没有定义用户标识、Session 生命周期和 Memory 写入边界。

文档入口

  • Overview:理解 GUMem 的定位、边界和核心能力。
  • Quick Start:用 Node SDK、Python SDK 或 cURL 完成第一次 Session 创建、写入和召回。
  • GUMem 如何工作:理解 Topic -> Summary -> Facts -> Message 的用户模型。
  • 多模态内容:了解文本、图片和 video 内容如何进入 GUMem。
  • 性能表现:查看 benchmark 和读写性能的评估口径。
  • 新增记忆:写入新的 Message。
  • 查询记忆:了解如何召回相关 Topic、Summary、Facts 和近期 Message。
  • Integration:查看 Node SDK 和 Python SDK 的完整接入说明。
  • User Case:查看 GUMem 在真实 Agent 回合中的使用方式。