Webnovel-Writer Harness v6 设计文档

日期：2026-04-02 状态：草案基于：用户反馈 + issue#5 token 分析 + 23 条问题清单

1. 终极目标

写出一本长篇网络小说（500-2000 章），支持多种主流题材。要求：

文笔优秀，减少 AI 味
剧情跌宕起伏，出人意料（AI 主导创意，作者事后审核）
长上下文后保持文风且不吃书
完善的人机协作，可注入作者灵感
系统稳定，减少上下文消耗
合适的错误改善机制

2. 核心原则

Claude Code 本身就是 harness——不另建编排层，充分利用原生能力（/resume、Task、子 agent 隔离、自动 compaction）
卷纲是 harness——给写作 AI 足够约束，防止跑偏、失控、遗忘
记忆是根基——防吃书靠记忆系统，不靠大纲节点
减法优先——砍掉不产生价值的环节，而非叠加更多流程

3. 问题清单（23 条）

3.1 Init

#	问题	根因
1	参考文件重结构轻范例	教了"格式"没教"品味"，LLM 知道填什么字段但不知道什么内容算好
2	缺少题材标杆	没有"好世界书长什么样"的真实小说范例作为 few-shot
3	生成不可迭代	总纲、设定集一次生成就结束，无打磨循环

3.2 Plan

#	问题	根因
4	约束了"发生什么"而非"方向和边界"	章纲写"主角救了叫朵朵的小女孩"→全量灌入写作 AI→剧透
5	缺少卷级叙事功能定义	每章在卷中承担什么角色（起/承/转/合）不明确
6	时间约束太显性	时间锚点、倒计时直接写在章纲里，AI 反复在正文中提及
7	Strand 比例硬编码 60/20/20	不同题材节奏不同，末世文和甜宠文不可能一样
8	四层产出下游利用率不明	节拍表、时间线、卷纲、章纲——write 阶段真正消费的只有章纲
9	10 章/批生成质量递减	后面几章趋向套路化

3.3 Write

#	问题	根因
10	流水线太重	8 步 + workflow 记录，大量 token 花在流程管理而非写作
11	context-agent 是 token 黑洞	全量灌入所有数据，输出巨大执行包
12	审查消耗大产出低	6 个 checker 各自独立 context，打 90 分但用户觉得很差
13	anti-AI 必须加强	黑名单只能挡已知口癖，挡不了叙事结构/情绪表达/节奏层面的 AI 味
14	data-agent 太重	9 个子步骤，归入记忆模块统一设计
15	写作和回写耦合	回写失败卡住整条链，但回写时机不变（下一章前必须完成）
16	workflow_manager + resume skill 浪费	Claude Code 原生 /resume 即可恢复中断会话

3.4 记忆

#	问题	根因
17	6 种存储太分散	state.json / index.db / scratchpad / summaries / vectors / snapshots 各自读写
18	分层不符合写作直觉	应按时效分级：近期（详细）→ 中期（摘要）→ 远期（活跃事实）
19	时间线不是索引轴	所有记忆应挂在时间线上，支持"第 N 章时角色是什么状态"的查询
20	记忆类型需明确	角色状态（可变）、世界规则（稳定）、伏笔（有生命周期）、时间线（单调递增）

3.5 系统级

#	问题	根因
21	Skill/Agent prompt 格式混乱	缺少统一模板，每个文件组织方式不同，LLM 抓不住重点
22	参考资料需要清理和补充	删冗余、补方法论（含真实小说片段作为正面/反面范例）
23	Token 消耗过高	单章 300-500 万，审查占大头但产出最低

4. 已确认的设计方向

4.1 废弃项

废弃	替代
workflow_manager.py	Claude Code 原生 /resume
resume skill	Claude Code 原生 /resume
Step 2B（独立风格适配步骤）	合并到 Step 4 润色
6 个独立 checker agent	合并为 1 个审查 agent
审查评分机制	改为 code review 格式输出具体问题清单
memory_scratchpad.json（长记忆系统）	基于远端无长记忆版本重新设计统一记忆模块

4.2 Write 流程（新）

Step 0.5 预检
  → Step 1 上下文搜集（context-agent，research 模式）
  → Step 2 起草
  → Step 3 审查（单 agent，code review 格式）
  → Step 4 润色 + 风格适配 + anti-AI
  → Step 5 数据回写（统一记忆模块，单次调用）
  → Step 6 Git 备份

4.3 Context-Agent（新模式）

从"一次性全量灌入 → 输出巨大执行包"改为 research 模式：

调用记忆模块合并接口 → 拿到基础上下文（章纲目标、角色状态、未闭合伏笔）
思考：这章还需要什么额外信息？
按需调用记忆模块独立接口补充（某角色历史、某条世界规则、上章结尾）
确认信息充分 → 按固定格式输出写作提示

4.4 审查（新模式）

1 个 agent，一次灌入正文 + 记忆中的角色状态/世界规则

输出格式为 code review 风格的问题清单：

[critical] 第3段：主角使用了第15章已失去的能力"xxx"
[high] 第7段：时间线矛盾——上章深夜，本章突然中午
[medium] 第12段：角色"张三"语气与已建立性格不符

不评分，不输出总分
anti-AI 检查作为审查的一部分，不单独成步

4.5 记忆模块（待设计）

已确认方向：

合并接口：commit_chapter()（写入） / load_context()（读取）
独立接口：query_entity() / query_rules() / read_summary() 等按需补查
按时效分层：近期（详细）→ 中期（摘要）→ 远期（活跃事实）
时间线作为索引轴
记忆类型：角色状态（可变）、世界规则（稳定）、伏笔（有生命周期）
具体实现方案搁置，待进一步思考

4.6 Plan（章纲约束重构方向）

章纲作为 harness 给 write 足够约束，但约束形式需要变：

约束"方向和边界"，不约束"具体发生什么"
时间约束隐性化——不在章纲里写死时间锚点，通过记忆系统间接传递，写后校验
Strand 比例按题材预设，不硬编码 60/20/20
卷级叙事功能——每章需要标注在卷中的叙事角色（起/承/转/合）
具体章纲字段设计待定

4.7 Skill/Agent Prompt 统一模板

每个 skill/agent 文件按固定结构编写：

1. 身份与目标
2. 可用工具与脚本（含调用方式）
3. 思维链（ReAct / 其他）
4. 输入
5. 执行流程（每步：输入 → 动作 → 输出）
6. 边界与禁区
7. 检查清单
8. 输出格式
9. 错误处理

4.8 参考资料

删除：冗余引用、已废弃文档、重复的 shared 引用（共 13 个文件）

补充（P0，16 条）：

反派设计、镜像反派、对手梯度、人物关系动力学
时间线设计、长篇升级节奏、反派压迫递进、伏笔埋设与回收
感情线递进、身份隐藏与曝光
暧昧/打脸/反转/对峙场景写法
章节开头钩子、章节结尾 cliffhanger

要求：每条方法论必须包含真实小说片段作为正面/反面范例

改造：现有 genres/ 和 write/references/ 下的文件从"结构模板"改为"方法论 + 范例 + 反面教材"

5. 未解决的设计问题

#	问题	状态
1	记忆模块具体实现（分层、存储、接口）	搁置，待进一步思考
2	章纲具体字段设计（什么算"方向和边界"）	待 plan 方案细化
3	anti-AI 的具体机制（超越黑名单的方案）	待写作 prompt 设计时解决
4	context-agent 输出的写作提示具体格式	待 write 方案细化
5	参考资料的真实小说片段收集	待用户收集
6	Init 的迭代打磨机制	待 init 方案细化
7	节拍表/时间线是否保留	待确认下游是否消费
8	批量生成章纲的最佳批次大小	待实验

6. Token 优化预估

环节	当前	优化后	节省
审查	~200 万（6 agent × ~33 万）	~40 万（1 agent）	~80%
Context-agent	~50 万（全量灌入）	~15 万（按需检索）	~70%
风格适配	~30 万（独立 Step 2B）	0（合并到润色）	100%
Workflow 记录	~5 万（16 次 CLI）	0（废弃）	100%
单章总计	300-500 万	预估 80-150 万	~60-70%

7. 实施路径（建议）

阶段	内容	依赖
Phase 1	废弃 workflow/resume + 审查合并 + Step 2B 合并	无
Phase 2	Skill/Agent prompt 统一模板 + 参考资料清理	真实小说片段收集
Phase 3	Context-agent research 模式重构	记忆模块设计
Phase 4	记忆模块统一设计与实现	用户设计确认
Phase 5	Plan 章纲约束重构	Phase 3+4
Phase 6	anti-AI 加强 + 写作 prompt 优化	Phase 2+3

2026-04-02-harness-v6-design.md 8.9 KB История Директен файл