长期记忆新架构规划（V2）

文档目标

基于长期记忆方向的论文与工程调研结果，重新规划 webnovel-writer 的目标架构。

这版架构不再把重点放在“补一个 scratchpad 文件”，而是把系统正式升级为：

记忆写入层
记忆存储层
记忆编排层
写作消费层

四层协同的长期记忆系统。

一句话结论

新架构应采用：

LIGHT 的三层记忆分层
Mem0 的独立 memory layer 思路
Zep / Graphiti 的时态事实与关系建模

也就是说，目标不是“在 ContextManager 上继续堆逻辑”，而是：

把记忆系统独立出来，让 ContextManager 退化成消费记忆编排结果的适配层。

为什么要重规划

旧方案的问题在于：

仍然以 ContextManager 为中心
更像“现有系统增强”
不够清晰地区分“写记忆”和“读记忆”

基于调研后，新的核心认识是：

长期记忆的关键不只是检索，而是写入与更新
长期记忆必须有自己的生命周期管理
事实、关系、时间线应当进入同一记忆体系
上下文组装只是消费层，不应继续承担全部核心职责

新架构核心原则

1. 记忆系统独立化

新增独立 memory 子系统，负责：

记忆抽取
记忆归档
记忆压缩
记忆检索
冲突裁决

2. 记忆分层化

固定分成三层：

Working Memory
Episodic Memory
Semantic/Scratchpad Memory

3. 时态事实化

角色状态、关系、势力、伏笔等信息都必须支持：

当前有效
历史版本
变更时间
来源证据

4. 消费与存储解耦

ContextManager 只负责消费记忆编排结果
写作技能/查询技能不直接拼接多源原始数据

目标总架构

┌──────────────────────────────────────────────────────────────┐
│                    Skills / Agents / Dashboard              │
│   write / review / query / resume / dashboard              │
└──────────────────────────┬───────────────────────────────────┘
                           │
                           ▼
┌──────────────────────────────────────────────────────────────┐
│                    Context Facade Layer                     │
│  ContextManager / extract_chapter_context / query adapter   │
│  只负责接收 Memory Orchestrator 输出并适配不同命令           │
└──────────────────────────┬───────────────────────────────────┘
                           │
                           ▼
┌──────────────────────────────────────────────────────────────┐
│                    Memory Orchestrator                      │
│  统一读取 Working / Episodic / Semantic Memory             │
│  做预算控制、相关性过滤、冲突裁决、输出 context pack         │
└───────────────┬───────────────────────┬──────────────────────┘
                │                       │
                ▼                       ▼
     ┌───────────────────┐   ┌───────────────────────────────┐
     │ Working Memory    │   │ Long-Term Memory Layer        │
     │ 近期写作上下文      │   │ Episodic + Semantic           │
     └───────────────────┘   └───────────────────────────────┘
                                          │
                                          ▼
                       ┌──────────────────────────────────────┐
                       │ Memory Write Pipeline                │
                       │ Chapter result -> extract -> update  │
                       └──────────────────────────────────────┘
                                          │
                                          ▼
                       ┌──────────────────────────────────────┐
                       │ Memory Storage Layer                 │
                       │ state/index/vectors/scratchpad/graph │
                       └──────────────────────────────────────┘

四层模型

1. 记忆写入层

这是新架构中最重要的新层。

职责

从章节产物中提取长期有效信息
判断哪些信息进入哪种记忆层
对已有事实做更新、失效、冲突标记
生成可供后续读取的标准化记忆项

写入入口

主入口仍然挂在 Step 5 / Data Agent 完成之后。

输入来源：

entities_new
entities_appeared
state_changes
relationships_new
chapter_meta
summary
plot_threads
后续可扩展：审查报告、用户偏好、人工修订

建议新增模块

scripts/data_modules/memory/
├── write_pipeline.py
├── extractors/
│   ├── fact_extractor.py
│   ├── relationship_extractor.py
│   ├── timeline_extractor.py
│   └── promise_extractor.py

设计理由

这部分吸收的是 Mem0 的思路：

记忆不是原样存对话
而是先做显著信息提炼，再写入 memory layer

2. 记忆存储层

新架构不废弃现有存储，而是重新定义职责。

2.1 `state.json`

继续保留，但职责进一步收缩为：

当前写作运行态
主角快照
进度
strand tracker
少量即时风险提示

不再承载长期知识沉淀。

2.2 `index.db`

继续作为结构化事实库，但要明确升级为：

episodic structured memory

主要存：

实体
别名
关系
关系事件
状态变化
chapter/meta
追读力和审查指标

2.3 `vectors.db`

继续作为：

episodic retrieval memory

主要存：

章节摘要
场景切片
后续可扩展：
- 长期摘要块 embedding
- 伏笔块 embedding
- 角色关系摘要块 embedding

2.4 `memory_scratchpad.json`

保留，但重新定义为：

semantic memory cache

它不应该只是一个杂项摘要文件，而应该是一个可压缩、高密度、面向消费的长期摘要缓存。

建议结构：

{
  "character_state": [],
  "story_state": [],
  "world_rules": [],
  "timeline": [],
  "open_loops": [],
  "reader_promises": [],
  "active_constraints": [],
  "meta": {}
}

2.5 `memory_graph.db` 或图表扩展

这是新规划中和旧方案最大的差异之一。

建议新增图记忆层，哪怕初期只是 SQLite 表，也要预留语义：

实体节点
关系边
时间有效性
来源章节
版本变化

形式上可以有两种方案：

保守方案：
- 先继续放在 index.db
- 新增 graph-oriented tables
进阶方案：
- 新建 memory_graph.db

第一阶段建议用保守方案，避免基础设施过重。

3. 记忆编排层

这是新的核心中台。

职责

按章节或查询意图读取三层记忆
根据任务类型动态分配预算
合并 working / episodic / semantic memory
对冲突事实做优先级裁决
输出标准化 context pack

建议新增模块

scripts/data_modules/memory/
├── orchestrator.py
├── budget_manager.py
├── relevance_filter.py
├── conflict_resolver.py
└── memory_pack.py

三层记忆定义

Working Memory

来源：

本章大纲
最近摘要
当前状态
当前 chapter guidance
当前债务与风险

特点：

强时效
高优先级
不需要长期存档

Episodic Memory

来源：

index.db
vectors.db
summaries

特点：

保留历史证据
可追溯
适合回答“发生过什么”

Semantic Memory

来源：

memory_scratchpad.json
图记忆层生成的高阶摘要

特点：

保留稳定抽象事实
适合回答“当前应该认为是真的是什么”

编排流程

写作请求
   │
   ▼
意图分析
   │
   ├── chapter_write
   ├── consistency_check
   ├── continuity_query
   └── review
   ▼
Memory Orchestrator
   │
   ├── load working memory
   ├── retrieve episodic memory
   ├── load semantic memory
   ├── resolve conflicts
   ├── apply budget
   └── build final pack

4. 写作消费层

这一层包括：

ContextManager
extract_chapter_context.py
/webnovel-write
/webnovel-query
/webnovel-review

新职责

不直接拼装底层数据
只根据任务类型请求 memory pack
将 memory pack 渲染成：
- text
- json
- prompt context

这意味着什么

ContextManager 不再是记忆逻辑中心，而是：

一个适配器
一个模板层
一个输出格式层

模块目录规划

建议新增独立目录：

webnovel-writer/scripts/data_modules/
├── memory/
│   ├── __init__.py
│   ├── schema.py
│   ├── storage.py
│   ├── write_pipeline.py
│   ├── orchestrator.py
│   ├── conflict_resolver.py
│   ├── relevance_filter.py
│   ├── budget_manager.py
│   ├── summary_compactor.py
│   └── graph_memory.py

各模块职责

`schema.py`

定义记忆项结构
定义状态字段与版本字段

`storage.py`

封装对 memory_scratchpad.json、index.db、vectors.db 的统一读写

`write_pipeline.py`

章节完成后写入记忆

`orchestrator.py`

对外提供统一 build_memory_pack()

`conflict_resolver.py`

处理 active / outdated / contradicted / tentative

`relevance_filter.py`

按章节目标、大纲关键词、实体中心过滤长期记忆

`budget_manager.py`

控制不同任务类型的 token 预算

`summary_compactor.py`

负责 scratchpad 压缩和去噪

`graph_memory.py`

封装关系图、时间线和事实图语义

数据模型重定义

统一记忆项

建议引入统一记忆对象结构：

{
  "id": "mem-001",
  "layer": "semantic",
  "category": "character_state",
  "subject": "xiaoyan",
  "field": "realm",
  "value": "筑基三层",
  "status": "active",
  "source": {
    "chapter": 128,
    "type": "state_change"
  },
  "evidence": [
    "state_change:xiaoyan:realm:128",
    "summary:ch0128"
  ],
  "updated_at": "2026-03-19T20:00:00+08:00",
  "confidence": 0.95
}

为什么需要统一记忆项

这样可以统一处理：

角色状态
世界规则
伏笔
读者承诺
关系变化
时间线事件

新架构的数据流

写入流

正文完成
   │
   ▼
Data Agent
   │
   ├── 原有写入：state/index/vectors/summaries
   └── Memory Write Pipeline
           │
           ├── 提取长期事实
           ├── 合并到 semantic memory
           ├── 更新 graph memory
           ├── 标记冲突和过期项
           └── 刷新 scratchpad cache

读取流

第N章写作 / 查询 / 审查
   │
   ▼
Memory Orchestrator
   │
   ├── Working Memory
   ├── Episodic Memory
   ├── Semantic Memory
   ├── Graph Memory
   └── Conflict Resolution
   ▼
Memory Pack
   ▼
ContextManager / Query Renderer / Review Renderer

对现有模块的角色调整

`ContextManager`

从：

核心上下文拼装器

变为：

memory pack 渲染器
模板权重应用器

`StateManager`

从：

运行态状态 + 部分知识写入

变为：

运行态状态管理器
章节结果写入入口
记忆写入流水线触发器

`IndexManager`

从：

结构化索引库

变为：

episodic structured memory backend

`RAGAdapter`

从：

场景检索器

变为：

episodic retrieval backend

关键取舍

不建议做的事

继续把所有逻辑堆进 ContextManager
只加一个 memory_scratchpad.json 就认为问题解决
第一阶段就引入完整图数据库
直接照搬 Letta/MemGPT 的 agent runtime

建议做的事

把 memory 作为独立子系统设计
先解决记忆写入问题，再优化读取
用统一记忆项结构降低后续复杂度
让图语义先以轻量方式落在现有 SQLite 中

最终目标

最终系统应具备以下能力：

写完一章后，系统能自动沉淀长期有效事实
多章之后，系统能区分历史事实和当前事实
写作前，系统能自动提供“近期上下文 + 历史证据 + 长期约束”
当关系、设定、伏笔变化时，系统能保留版本与证据
审查和查询模块能共享同一套长期记忆底座

总结

基于调研，新的最佳架构不是“在现有系统上补一个功能点”，而是：

把长期记忆升级为一个独立子系统，并让现有写作系统围绕它重新分层。

这版架构比旧方案更适合长期演化，也更符合当前长期记忆研究和工程实践的主流方向。

long-term-memory-architecture-v2.md 14 KB Riwayat Mentahan

长期记忆新架构规划（V2）

文档目标

一句话结论

为什么要重规划

新架构核心原则

1. 记忆系统独立化

2. 记忆分层化

3. 时态事实化

4. 消费与存储解耦

目标总架构

四层模型

1. 记忆写入层

职责

写入入口

建议新增模块

设计理由

2. 记忆存储层

2.1 state.json

2.2 index.db

2.3 vectors.db

2.4 memory_scratchpad.json

2.5 memory_graph.db 或图表扩展

3. 记忆编排层

职责

建议新增模块

三层记忆定义

Working Memory

Episodic Memory

Semantic Memory

编排流程

4. 写作消费层

新职责

这意味着什么

模块目录规划

各模块职责

schema.py

storage.py

write_pipeline.py

orchestrator.py

conflict_resolver.py

relevance_filter.py

budget_manager.py

summary_compactor.py

graph_memory.py

数据模型重定义

统一记忆项

为什么需要统一记忆项

新架构的数据流

写入流

读取流

对现有模块的角色调整

ContextManager

StateManager

IndexManager

RAGAdapter

推荐实施顺序

Stage 1：搭 memory 子系统骨架

Stage 2：接写入管线

Stage 3：接编排器

Stage 4：接图记忆

Stage 5：扩展 dashboard 和观测

关键取舍

不建议做的事

建议做的事

最终目标

总结

long-term-memory-architecture-v2.md 14 KB

Riwayat Mentahan

2.1 `state.json`

2.2 `index.db`

2.3 `vectors.db`

2.4 `memory_scratchpad.json`

2.5 `memory_graph.db` 或图表扩展

`schema.py`

`storage.py`

`write_pipeline.py`

`orchestrator.py`

`conflict_resolver.py`

`relevance_filter.py`

`budget_manager.py`

`summary_compactor.py`

`graph_memory.py`

`ContextManager`

`StateManager`

`IndexManager`

`RAGAdapter`