Go to Dashboard

Overview

GUMem（General User Memory）是面向Agent的生产可用的记忆引擎。它接收对话消息和行为记录，抽取出后续任务可复用的 Memory，并在新的 Agent 回合中召回相关上下文。

GUMem memory overview

核心特点

行为记忆与会话记忆融合分析：覆盖用户对话、工具调用、业务事件和行为记录，帮助 Agent 提取用户画像、偏好和意图。
长短记忆分层抽取：使用 ActionLogs / Messages -> Facts -> Summaries -> Topics 的记忆层次，在保留事实依据的同时提升长期记忆的信息密度。
超长对话记忆表现突出：在 LoCoMo benchmark 上取得 92.9% Judge 准确率，适合长会话、跨主题历史和时间相关记忆场景。
开发者友好：记忆数据支持用户自由管理，并且提供自定义 WebHooks 调整记忆生成、过滤和治理逻辑，使得开发者对记忆数据具备全面的掌控力。

最小接入链路

创建 Session，并把它绑定到你的业务用户标识。
在对话或行为发生后写入 Message。
在下一轮 Agent 响应前调用 Query Memory。
把返回的 formatted_context 或结构化 Memory 放入模型上下文。
回复生成后，把新的用户消息和 assistant 回复写回 GUMem。

这条链路的顺序很重要：先召回，再生成，再写回。这样 Agent 使用的是进入本轮前已经沉淀的 Memory，而不是把当前回复误当作历史事实。

文档入口

Quick Start：用 Node SDK、Python SDK 或 cURL 完成第一次接入。
GUMem 如何工作：理解 Message、Facts、Summary 和 Topic 的关系。
多模态内容：了解文本、图片和 video 内容如何进入 GUMem。
新增记忆：写入新的 Message。
查询记忆：了解如何召回 Topic、Summary、Facts 和近期 Message。
User Case：查看 GUMem 在典型 Agent 回合中的使用方式。