Skip to content
Go to Dashboard

Overview

GUMem(General User Memory)是面向Agent的生产可用的记忆引擎。它接收对话消息和行为记录,抽取出后续任务可复用的 Memory,并在新的 Agent 回合中召回相关上下文。

GUMem memory overview

核心特点

  1. 行为记忆与会话记忆融合分析:覆盖用户对话、工具调用、业务事件和行为记录,帮助 Agent 提取用户画像、偏好和意图。
  2. 长短记忆分层抽取:使用 ActionLogs / Messages -> Facts -> Summaries -> Topics 的记忆层次,在保留事实依据的同时提升长期记忆的信息密度。
  3. 超长对话记忆表现突出:在 LoCoMo benchmark 上取得 92.9% Judge 准确率,适合长会话、跨主题历史和时间相关记忆场景。
  4. 开发者友好:记忆数据支持用户自由管理,并且提供自定义 WebHooks 调整记忆生成、过滤和治理逻辑,使得开发者对记忆数据具备全面的掌控力。

最小接入链路

  1. 创建 Session,并把它绑定到你的业务用户标识。
  2. 在对话或行为发生后写入 Message。
  3. 在下一轮 Agent 响应前调用 Query Memory。
  4. 把返回的 formatted_context 或结构化 Memory 放入模型上下文。
  5. 回复生成后,把新的用户消息和 assistant 回复写回 GUMem。

这条链路的顺序很重要:先召回,再生成,再写回。这样 Agent 使用的是进入本轮前已经沉淀的 Memory,而不是把当前回复误当作历史事实。

文档入口

  • Quick Start:用 Node SDK、Python SDK 或 cURL 完成第一次接入。
  • GUMem 如何工作:理解 Message、Facts、Summary 和 Topic 的关系。
  • 多模态内容:了解文本、图片和 video 内容如何进入 GUMem。
  • 新增记忆:写入新的 Message。
  • 查询记忆:了解如何召回 Topic、Summary、Facts 和近期 Message。
  • User Case:查看 GUMem 在典型 Agent 回合中的使用方式。