本文档汇总大语言模型长期记忆方向中较有代表性的论文、基准和开源项目,重点回答四个问题:
webnovel-writer 最值得借鉴的能力是什么说明:
当前长期记忆方向已经很明确地形成了三条主线:
外部记忆 + 检索:把历史信息存到外部存储,再按需召回分层记忆 + 编排:把近期上下文、历史证据、长期摘要分层管理图结构 / 时态记忆:用知识图谱或时态图来处理事实更新、关系变化和时间推理对我们项目最直接有用的不是“更大上下文”,而是:
代表性基准都在说明同一件事:
这一点在以下基准中都被反复验证:
LoCoMoLongMemEvalBEAM论文:
Evaluating Very Long-Term Conversational Memory of LLM Agents关键点:
300 turns9K tokens35 sessions价值:
来源:LoCoMo 论文摘要页 https://arxiv.org/abs/2402.17753
论文:
LongMemEval: Benchmarking Chat Assistants on Long-Term Interactive Memory关键点:
500 个精心构造的问题30% 下滑价值:
来源:LongMemEval 论文摘要页 https://arxiv.org/abs/2410.10813
论文:
Beyond a Million Tokens: Benchmarking and Enhancing Long-Term Memory in LLMs关键点:
10M tokens 的连贯对话100 段对话和 2000 个校验问题LIGHT 记忆框架3.5% - 12.69%价值:
来源:BEAM/LIGHT 论文摘要页 https://arxiv.org/abs/2510.27246
MemoryBank: Enhancing Large Language Models with Long-Term Memory核心思想:
意义:
局限:
Augmenting Language Models with Long-Term Memory核心思想:
意义:
局限:
MemGPT: Towards LLMs as Operating Systems核心思想:
意义:
局限:
Beyond a Million Tokens: Benchmarking and Enhancing Long-Term Memory in LLMs核心思想:
episodic memoryworking memoryscratchpad意义:
局限:
Mem0: Building Production-Ready AI Agents with Scalable Long-Term Memory核心思想:
官方声称:
+26% 提升工程价值:
局限:
来源:
Zep: A Temporal Knowledge Graph Architecture for Agent Memory核心思想:
Graphiti 作为时态知识图谱引擎论文报告:
18.5%90%工程价值:
来源:Zep 论文摘要页 https://arxiv.org/abs/2501.13956
MIRIX: Multi-Agent Memory System for LLM-Based Agents核心思想:
意义:
局限:
来源:MIRIX 论文摘要页 https://arxiv.org/abs/2507.07957
官方定位:
stateful agents值得关注的点:
对我们的启发:
来源:
官方定位:
Universal memory layer for AI Agents值得关注的点:
对我们的启发:
来源:Mem0 官方仓库 README https://github.com/mem0ai/mem0
官方定位:
Build Real-Time Knowledge Graphs for AI Agents特点:
对我们的启发:
来源:Graphiti 官方仓库 README https://github.com/getzep/graphiti
近两年最明确的结论是:
早期系统重点是:
近年的重点已经变成:
在纯向量检索之外,越来越多系统开始强调:
这对任何“事实会变化”的系统都非常关键。
像 Mem0、Zep 这类项目,不再只讲准确率,而是同时强调:
最适合我们当前项目的核心抽象仍然是:
working memoryepisodic memoryscratchpad原因:
对小说系统特别重要的是:
所以光做向量检索不够,必须有事实状态和时间语义。
Mem0 很值得借鉴的是:
这对我们把长期记忆做成独立模块非常有帮助。
webnovel-writer 的映射建议如果以“对当前项目收益 / 改造成本”排序,我建议优先关注:
LIGHTMem0Zep / GraphitiMemGPT / LettaMIRIXMemoryBankLongMem长期记忆方向现在已经很清楚:
对当前项目来说,最现实的路线不是做一个通用 agent 平台,而是:
state.json / index.db / vectors.dbscratchpad 长期摘要层memory orchestrator这条路线与近期论文结论最一致,也最贴合当前系统基础。