Webnovel Writer Story Intelligence System 理想态重构 Spec

日期：2026-04-12 状态：草案 v2 定位：理想态总架构蓝图

1. 文档定位

1.1 这份 spec 解决什么问题

当前 webnovel-writer 已经具备以下能力：

references/csv/ 提供条目化知识检索
references/*.md 提供方法论与流程约束
scripts/data_modules/ 提供 state / index / memory / context 的运行时能力
skills/webnovel-* 提供初始化、规划、写作、审查等执行入口

但当前系统更准确的状态是：

已经具备 L0 / L1 / L2 的按步加载能力
已经具备 md 必读 + CSV 检索 的双轨 reference 体系
已经具备 context_manager + genre_* 这类半成品聚合能力

真正缺的不是“会不会按需读取资料”，而是：

缺少统一的聚合中间层，把题材、节奏、桥段、毒点、人设、金手指装成一个系统
reference_search.py 只能返回散条目，不能生成稳定的故事系统合同
context_manager / genre_* 还没有演进成可持久化的 Story Contract
全局设定与章节局部要求没有稳定的 Master + Overrides 承载结构

本 spec 的目标不是继续增强“检索”，而是把项目升级成一个：

先推理
再聚合
再持久化
最后由 skill 消费合同

的 Story Intelligence System。

1.2 与现有 spec 的关系

仓库中已有：

2026-04-09-skills-restructure-and-reference-gaps.md
2026-04-12-story-system-pro-max-retrofit-spec.md

它们分别解决：

2026-04-09：skills / references / scripts 的职责边界与资料缺口
2026-04-12 retrofit：在不大改现有链路的前提下，为现系统补一个较保守的 story_system

本 spec 与它们不同：

本 spec 不以兼容旧入口为前提
本 spec 不遵守最小改动原则
本 spec 讨论的是项目的理想态重构目标

换句话说：

retrofit spec 是“怎么稳妥地补”
本 spec 是“如果重做一版，最优架构应该长什么样”

1.2.1 与 retrofit spec 的复用 / 替代边界

为避免后续实施时两份 spec 相互打架，这里明确边界：

可直接复用的部分

CSV 通用列契约
reference_search.py 作为底层 primitive 的定位
.story-system/ 作为持久化目录的基本方向
anti-pattern 的“显式负面字段优先”原则
StorySystemDict 作为 phase 1 JSON contract 的种子结构

本 spec 对 retrofit 的超集扩展

把两层持久化扩展为 Master / Volume / Chapter 三层
把 StorySystemDict 扩展为合同家族，而不再只是一份聚合结果
把 skills 的定位从“直接读 reference”升级为“合同优先 + 局部按需加载”
把 state / memory / index 明确下沉为运行时事实层

本 spec 对 retrofit 的替代决策

story_system.py 不再只是一个附加脚本，而是未来的一线中枢
genre-profiles.md 不再担任核心配置中心
templates/genres/*.md 不再担任题材主知识源

如果两份 spec 出现冲突，裁决原则为：

phase 1 工程落地，优先服从 retrofit spec
phase 2 及以后重构目标，优先服从本 spec

1.3 借鉴对象

本 spec 明确借鉴 ui-ux-pro-max-skill 的核心链路，而不是照搬它的文件名：

多域数据仓
reasoning engine
聚合器
anti-patterns 汇总
稳定输出 contract
skill 以 contract 为主消费系统信息

对 webnovel-writer 来说，真正需要学习的是这条系统链，而不是“多几个 CSV”。

2. 设计结论

2.1 一句话结论

webnovel-writer 的理想态，不应再是：

md reference + csv search + skill 手动拼装

而应重构为：

Reasoning Layer + Multi-domain Knowledge Layer + Story System Generator + Persistence Contracts + Skill Runtime

2.2 核心判断

判断 1：CSV 应成为主知识层

references/csv/ 已经具备良好的条目化方向，理想态中它应升级为：

主知识层
主检索层
主规则层

而不是“补充资料”。

判断 2：MD 应降级为方法论层

references/*.md 中的方法论、审查规则、AI 味规避、流程规范，仍应保留为 md。

但它们不再直接承担：

题材配置中心
故事系统主设定
skill 主输入源

判断 3：skill 不应再直接读散乱 reference

webnovel-init / plan / write / review 的最佳状态是：

不直接拼装多份 reference
不直接决定先查什么表、再查什么 md
只消费统一生成的 story contract

但这里的“只消费合同”，不是说 skill 从此不再按步加载任何 reference，而是指：

全局设定、题材调性、毒点红线、系统边界应优先来自 contract
局部写作技法、场景模式、命名规则、排版和审查规范仍可按 step 按需加载

判断 4：原有 data_modules 不是废弃，而是下沉为运行时底盘

现有：

state.json
memory_contract
index.db / vectors / bm25
context_manager
query_router

都仍然有价值。

但它们的定位应从“主流程拼装器”变为：

运行时事实层
检索证据层
写作执行支持层

2.3 Contract 与渐进式披露的分工

本 spec 不推翻 2026-04-09 中“渐进式披露 + 双轨制 + 按需加载”的哲学，而是重新划分消费边界。

由 contract 优先承接的内容

题材推理结果
全局调性与节奏承诺
anti_patterns
system_constraints
卷级 / 章级目标
override ledger

这些内容的共同特点是：

影响全局
需要跨 step 稳定一致
不适合每个 skill 临时再拼一次

但运行时还必须补一条消费边界：

skill 默认消费的是最终结算态
完整 override ledger 默认属于审计 / debug / dashboard 数据
写作 prompt 只应拿到“本章相关的 override 摘要”，不应注入全量历史账本

继续由按需 reference 承接的内容

写作技法
场景模式
命名规则
对话口吻
排版规范
润色与 anti-ai 修正
review schema 与 blocking override 规则

这些内容的共同特点是：

强依赖具体 step
触发条件明确
更像“局部执行手册”而不是“全局故事合同”

因此理想态不是“contract 替代所有 reference”，而是：

contract 接管全局系统信息
step-bound reference 保留局部执行知识

3. 目标与非目标

3.1 目标

理想态重构要达成 8 个目标：

建立统一的题材推理层
建立统一的多域知识仓
建立统一的故事系统生成器
建立统一的 anti-pattern 汇总机制
建立统一的 Master / Volume / Chapter 合同结构
建立统一的持久化目录 .story-system/
让 skills 只消费合同，不再直接拼 reference
让现有 state / index / memory 数据链继续作为运行时事实层

3.2 非目标

本 spec 明确不追求以下事情：

不保留旧 CLI 的完全兼容调用方式
不要求 reference_search.py 继续作为一线入口
不要求 genre-profiles.md 继续担任核心配置中心
不要求每个旧模板都被保留原职责
不要求为每条知识点编写测试

3.3 知识迁移边界

知识迁移必须遵守以下硬规则：

AI味、去 AI 腔、润色替换规则，不进入 CSV
这类内容继续保留在独立 md 文件
知识迁移只允许人工整理和人工录入
禁止编写“把 md 自动抽成 csv 条目”的迁移脚本

这里的“禁止脚本迁移”，针对的是知识内容迁移，不针对正常的工程脚本开发。

4. 理想态总架构

4.1 总体分层

理想态系统分为五层：

Reasoning Layer
Knowledge Layer
Contract Layer
Persistence Layer
Skill Runtime Layer

4.2 分层关系

用户意图 / 题材诉求
        ↓
Reasoning Layer
        ↓
Knowledge Layer
        ↓
Story System Generator
        ↓
Contract Layer
        ↓
Persistence Layer
        ↓
Skill Runtime Layer
        ↓
正文 / 大纲 / 审查 / 状态回写

4.3 推荐目录

${CLAUDE_PLUGIN_ROOT}/
├── story_system/
│   ├── data/
│   │   ├── reasoning/
│   │   ├── rules/
│   │   ├── tropes/
│   │   ├── characters/
│   │   ├── pacing/
│   │   └── naming/
│   ├── engine/
│   │   ├── search_engine.py
│   │   ├── reasoning_engine.py
│   │   ├── aggregator.py
│   │   ├── anti_pattern_engine.py
│   │   ├── contract_builder.py
│   │   ├── renderer.py
│   │   └── persistence.py
│   ├── runtime/
│   │   ├── memory_bridge.py
│   │   ├── state_bridge.py
│   │   ├── index_bridge.py
│   │   └── review_bridge.py
│   ├── templates/
│   │   ├── master_setting.md.j2
│   │   ├── volume_brief.md.j2
│   │   ├── chapter_brief.md.j2
│   │   ├── anti_patterns.md.j2
│   │   └── review_contract.md.j2
│   └── cli.py
├── references/
│   ├── csv/
│   ├── shared/
│   ├── outlining/
│   └── review/
├── skills/
└── scripts/

${PROJECT_ROOT}/
├── .webnovel/
└── .story-system/

说明：

这里采用的是插件运行时目录模型，不是当前源码仓库目录模型
当前开发仓库只用于产出插件，不参与运行时 story contract 的落盘路径判定
CLAUDE_PLUGIN_ROOT 是插件安装目录，负责承载代码、skills、scripts、references
PROJECT_ROOT 是真实书项目根目录，定义为包含 .webnovel/state.json 的目录
.story-system/ 必须落在 PROJECT_ROOT 下，而不是 CLAUDE_PLUGIN_ROOT
story_system/ 是新的一线中枢
旧 scripts/reference_search.py 与 scripts/data_modules/ 可继续存在，但不再承载主设计中心
engine/ 下的多个文件表示“职责分层目标”，不是 day 1 必须拆成 7 个文件

4.4 初始实现颗粒度

理想态需要清晰的职责边界，但不意味着第一版工程实现必须把每个职责拆成独立文件。

推荐做法：

phase 1 可先合并为 search_reasoning.py + contract_runtime.py + persistence.py
phase 2 再按职责拆成更细模块

也就是说：

架构分层要先定清
文件颗粒度可以渐进收敛

5. Reasoning Layer 设计

5.1 职责

Reasoning Layer 是整个系统的大脑，负责把模糊的创作意图，转成可执行的系统约束。

它回答的不是：

“某个技巧怎么写”

而是：

这本书本质上是什么题材
核心读者承诺是什么
应该优先交付什么爽点
节奏应该偏快还是偏压抑
哪些毒点绝对不能碰
后续应该优先检索哪些知识域

5.2 核心数据表

新增核心路由表：

文件名：题材与调性推理.csv
中文名：题材与调性推理

5.3 建议字段

题材与调性推理.csv 仍然必须遵守现有 CSV 通用契约。

这里列出的，是通用列之外的专属列：

字段	说明
`题材/流派`	主题材名
`中文名`	供人读的标准名
`题材别名`	黑话、俗称、平台常用叫法
`核心调性`	草根逆袭、极致拉扯、压抑蓄爆、诡异压迫等
`节奏策略`	黄金三章、慢热蓄势、持续兑现、节点爆发等
`主爽点`	该题材最核心的兑现类型
`辅助爽点`	次级交付
`冲突引擎`	冲突主要如何生成
`适配人设`	推荐的人设框架
`适配金手指`	推荐的外挂或设定类型
`适配桥段`	高频桥段方向
`强制禁忌/毒点`	题材级红线
`推荐基础检索表`	生成系统时优先查的基础域
`推荐动态检索表`	生成卷/章简报时优先查的动态域
`默认查询词`	当用户输入模糊时的扩展查询词

5.4 题材推理原则

推理顺序应为：

识别主题材
识别辅题材
识别核心承诺
锁定调性
锁定节奏
锁定毒点
生成后续多域检索计划

这里必须允许“主辅题材”结构，而不是只识别单一标签。

5.5 多标签推理规则

网文题材经常不是单标签，而是：

赛博朋克 + 克苏鲁
修仙 + 直播
都市异能 + 恋爱修罗场

因此 reasoning engine 不应采用简单的 Top 1 命中逻辑，而应支持多标签加权融合。

建议规则如下：

先识别 主题材
再识别 辅题材
核心调性 以主题材为主，辅题材只允许调味，不得反客为主
强制禁忌/毒点 采用并集策略
主爽点 按主题材排序，辅助爽点 允许来自辅题材
推荐基础检索表 / 推荐动态检索表 采用加权合并，而不是单条覆盖

简化说法：

调性允许主次
毒点必须并集
检索计划必须融合

这条规则必须写进实现，而不能只停留在概念层。

5.6 Reasoning Engine 实现边界

reasoning engine 不能走向两个极端：

不能试图用纯规则代码“理解一切文学语义”
也不能把题材识别、调性融合、毒点判断全部放给 LLM 黑盒完成

推荐采用 L0 / L1 / L2 三层：

L0 Deterministic Router
L1 Deterministic Fusion
L2 LLM Classifier / Synthesizer

L0：确定性路由

负责：

alias 归一化
显式标签提取
BM25 / 关键词候选召回
置信度初算

这层的职责是把自然语言意图收敛成候选集合，而不是直接输出最终文学判断。

L1：确定性融合

负责：

主辅题材候选加权
毒点并集
基础检索计划融合
生成“可离线运行”的 baseline contract

这层保证：即便没有 LLM，也能对清晰输入产出一个可用但偏保守的 MASTER。

L2：LLM 分类 / 融合

只有在以下场景才启用：

输入低置信
题材混搭明显
调性描述高度模糊
多候选之间差距不足以稳定裁决

LLM 的职责不是自由发挥，而是：

在候选集合内做分类或重排
解释为什么某个融合更合理
产出严格结构化 JSON

随后必须经过本地 schema 校验，失败则回退到 L1 baseline。

默认要求：

离线可运行
不依赖 LLM 也能生成可用的 MASTER
LLM 负责语义补洞与模糊融合，不负责绕过规则层直接产生命令式合同

fallback 策略：

若 L0 + L1 已得到高置信结果，则不调用 LLM
若结果低置信，先输出候选题材列表和冲突点
若启用 LLM 辅助，再让 LLM 仅基于候选集合输出结构化融合建议
若 LLM 输出未通过校验，则丢弃该结果并回退到确定性 baseline

这样做的目的，是把：

成本
延迟
可用性
可解释性
可测试性

同时控制在工程可接受范围内

6. Knowledge Layer 设计

6.1 知识分层

理想态中，知识层应分成三类，而不是全塞在一起：

Reasoning Tables
Rule Tables
Methodology Docs

6.2 Reasoning Tables

这些表负责“全局推理与路由”：

文件名	中文名	角色
`题材与调性推理.csv`	题材与调性推理	题材路由与全局调度

6.3 Rule Tables

这些表负责“结构化规则与条目知识”：

文件名	中文名	角色
`命名规则.csv`	命名规则	人名、地名、势力、功法等命名规则
`场景写法.csv`	场景写法	战斗、对话、冲突、桥段场景的写法模式
`写作技法.csv`	写作技法	技法与误区
`桥段套路.csv`	桥段套路	套路、铺垫、反转、变种
`人设与关系.csv`	人设与关系	人设原型、关系互动、禁区
`爽点与节奏.csv`	爽点与节奏	节奏阶段、情绪调度、崩盘误区
`金手指与设定.csv`	金手指与设定	金手指、世界规则、限制、代价

建议后续补两张表：

文件名	中文名	角色
`冲突设计.csv`	冲突设计	冲突触发源、升级链、回收方式
`反派机制.csv`	反派机制	反派逻辑、层级、失败方式、禁区

6.4 Methodology Docs

这些内容继续保留 md，不进 csv：

review-schema.md
reading-power-taxonomy.md
shared/core-constraints.md
webnovel-write/references/anti-ai-guide.md
webnovel-write/references/polish-guide.md
webnovel-write/references/style-adapter.md

原因很简单：

它们是流程与方法论
不是检索条目
强行塞入 csv 会劣化表达

7. Contract Layer 设计

7.1 核心思想

skill 不应再直接消费：

散乱 CSV 结果
多份 md 引用
零散模板

skill 只应消费标准合同。

7.2 合同类型

理想态至少有五类合同：

MASTER_SETTING
VOLUME_BRIEF
CHAPTER_BRIEF
ANTI_PATTERNS
REVIEW_CONTRACT

7.3 每类合同的职责

MASTER_SETTING

负责全书级稳定设定：

题材与调性
主角与核心角色基线
世界规则与金手指边界
全局节奏策略
全局毒点

VOLUME_BRIEF

负责卷级目标：

本卷核心冲突
本卷兑现目标
本卷反派层级
本卷关键桥段
本卷节奏波形

CHAPTER_BRIEF

负责本章执行要求：

本章目标
本章桥段
本章场景策略
本章情绪预期
本章禁区

ANTI_PATTERNS

负责把所有题材级、桥段级、角色级、节奏级毒点聚合成显式红线。

REVIEW_CONTRACT

负责告诉审查环节：

本章/本卷必须检查什么
哪些红线最优先
哪些风险点是题材特定风险

7.4 双产物要求与单一真理源

每份合同可以同时存在两种产物：

Markdown
JSON

但必须明确：

JSON 是唯一真理源
Markdown 只是从 JSON 渲染出的只读产物

原因：

Markdown 给人看
JSON 给程序和 skill 稳定消费
一旦允许人手改 Markdown，就会出现双重真理源

因此必须执行以下硬规则：

所有持久化更新先改 JSON，再渲染 Markdown
Markdown 顶部必须显式标注 GENERATED FILE / DO NOT EDIT
skill、runtime、dashboard、测试一律只消费 JSON，不消费 Markdown 作为真值
人工修订只能通过 CLI / Dashboard / 显式 JSON 编辑入口完成，不支持“手改 Markdown 自动回写”

如果 Markdown 被人工修改：

视为非受支持操作
下次渲染时允许被覆盖

7.4.1 与 Retrofit Spec 的 Markdown 迁移裁决

这里需要与 retrofit spec 的 marker 方案明确裁决，避免两份 spec 在 phase 1/2 打架。

phase 1

服从 retrofit spec
若 Markdown 中存在  / END 自动生成区块，则脚本只更新 marker 内内容
marker 外的人工备注区可暂时保留

phase 2 及以后

服从本 spec
Markdown 退化为从 JSON 全量重建的只读渲染产物
phase 1 的 marker 兼容逻辑可以废弃

无论 phase 1 还是 phase 2，都必须坚持：

JSON 是唯一真理源
marker 外人工备注不构成合同真值
skill/runtime/test 一律不以 Markdown 作为真值输入

7.5 JSON 合同校验

既然 JSON 要作为 skill 的稳定输入，就不能只“尽量输出正确”，而必须做结构校验。

建议实现：

为 MASTER_SETTING / VOLUME_BRIEF / CHAPTER_BRIEF / REVIEW_CONTRACT 定义显式 schema
使用 Pydantic 或等价 schema 校验机制
在生成 JSON 后先做本地校验，再落盘
校验失败时不得生成“看起来成功、实际结构不稳定”的伪合同

最低要求：

anti_patterns 必须始终是列表
overrides 必须始终是结构化对象
locked / append_only / override_allowed 必须可机读
lock_policy 必须始终可机读
缺省值要稳定，不能时而为空字符串、时而为空数组

这不是“测试增强”，而是合同系统的基础完整性约束。

7.5.1 Schema Version 与兼容策略

所有合同 JSON 都必须带版本元数据，最低要求：

schema_version
contract_type
generator_version

推荐规则：

schema_version 使用显式字符串，例如 story-system/v1
读取方必须先校验 schema_version，再决定：
- 直接读取
- 运行显式 migrator
- 报错并要求人工升级
禁止在 schema 不兼容时静默忽略字段
phase 1 由 StorySystemDict 过渡来的合同，也必须显式写入版本号，而不是默认“无版本”

否则 phase 1 生成的旧合同进入 phase 2 后，会在新代码下出现“静默丢字段”或“校验失败但原因不明”的问题。

7.6 合同 JSON 基线

本 spec 不从零重新发明 JSON contract，而采用以下策略：

phase 1 复用 retrofit spec 中的 StorySystemDict 作为基础结构
phase 2 在其外层扩展出 MASTER / VOLUME / CHAPTER / REVIEW / ANTI_PATTERNS 五类合同

最小字段要求如下。

`MASTER_SETTING.json`

至少包含：

meta
genre_reasoning
core_rules
anti_patterns
system_constraints
contracts
overrides

`VOLUME_BRIEF.json`

至少包含：

meta
volume_goal
selected_tropes
selected_pacing
selected_scenes
anti_patterns
system_constraints
overrides

`CHAPTER_BRIEF.json`

至少包含：

meta
chapter_goal
scene_strategy
hook_strategy
must_cover
anti_patterns
system_constraints
overrides

这里的 system_constraints 与 anti_patterns 必须区分：

anti_patterns：明确禁止项
system_constraints：能力边界、世界规则、数值限制

一个实用判据是：

违反后会直接让读者觉得“有毒、崩盘、降智”的，归入 anti_patterns
违反后会先造成设定自洽性破裂、逻辑漏洞或数值失衡的，归入 system_constraints

例如：

金手指每天只能用三次 属于 system_constraints
打脸桥段必须靠反派强行降智才能成立 属于 anti_patterns

`REVIEW_CONTRACT.json`

至少包含：

meta
must_check
blocking_rules
genre_specific_risks
anti_patterns
system_constraints
review_thresholds
overrides

其中：

must_check：本章/本卷必须重点检查的审查项
blocking_rules：命中后直接阻断通过的规则
genre_specific_risks：题材特定高风险点
review_thresholds：各维度最低通过阈值或 blocking 条件

7.6.1 `StorySystemDict` 到合同家族的映射

为避免 phase 1 的 StorySystemDict 到 phase 2 的合同家族迁移时产生歧义，这里给出最小映射。

`StorySystemDict` 字段	phase 2 目标位置	说明
`meta`	`MASTER_SETTING.meta`	生成来源、查询词、时间戳等元信息
`route`	`MASTER_SETTING.genre_reasoning`	题材路由、候选题材、命中依据
`master_constraints`	`MASTER_SETTING.core_rules` + `MASTER_SETTING.system_constraints`	题材调性、世界边界、硬约束分拆进入核心规则与系统边界
`base_context`	`MASTER_SETTING.contracts.base_context_seed`	基础表命中结果作为全书级种子上下文
`dynamic_context`	`VOLUME_BRIEF.selected_*` + `CHAPTER_BRIEF.scene_strategy / hook_strategy / must_cover`	phase 2 由“动态上下文”拆成卷级选择与章级执行要求
`anti_patterns`	各级合同中的 `anti_patterns` + 派生 `anti_patterns.json`	条目级与题材级毒点进入各合同，再生成运行时聚合视图
`override_policy`	`MASTER_SETTING.contracts.override_policy`	字段覆盖规则与默认 policy
`source_trace`	各合同 `meta.source_trace` 或审计区	调试、审计与追溯信息

这张映射表的作用不是冻结最终字段名，而是明确：

phase 1 的扁平聚合结果不会直接消失
它会被拆分并沉淀到更细粒度的合同家族中
实施时不得靠“语义猜测”去决定字段归属

8. Persistence Layer 设计

8.1 目录规范

在真实书项目根目录 PROJECT_ROOT 下建立：

PROJECT_ROOT/
├── .webnovel/
└── .story-system/
    ├── MASTER_SETTING.md
    ├── MASTER_SETTING.json
    ├── anti_patterns.md
    ├── anti_patterns.json
    ├── volumes/
    │   ├── volume_001.md
    │   ├── volume_001.json
    │   └── ...
    └── chapters/
        ├── chapter_001.md
        ├── chapter_001.json
        └── ...

补充规则：

*.json 是合同真源
*.md 是渲染产物
渲染器必须支持“从 JSON 全量重建 Markdown”
skills/agents 默认从 WORKSPACE_ROOT 出发，但必须先统一解析到真实 PROJECT_ROOT 再读写 .story-system/

8.1.1 `ANTI_PATTERNS` 独立文件与各级合同的关系

这里必须避免双真理源：

MASTER_SETTING / VOLUME_BRIEF / CHAPTER_BRIEF 中各自的 anti_patterns 字段，才是分层真源
.story-system/ 根目录下的 anti_patterns.json 是派生聚合视图
anti_patterns.md 只从 anti_patterns.json 渲染

也就是说：

MASTER_SETTING.json.anti_patterns 负责全书级红线
VOLUME_BRIEF.json.anti_patterns 负责卷级补充红线
CHAPTER_BRIEF.json.anti_patterns 负责章级补充红线
anti_patterns.json 负责把“当前可见层级”的红线汇总成运行时/审计友好的扁平视图

若出现冲突，以各级合同中的分层字段为准，anti_patterns.json 必须重算，不得反向成为真源。

8.1.2 命名与版本控制约束

文件命名规范：

卷文件统一使用零填充编号：volume_001.json
章文件统一使用零填充编号：chapter_001.json
人类可读标题放在 meta.title 中，而不是写进文件名

版本控制建议：

.story-system/*.json 与其对应的主 Markdown 渲染文件应默认纳入 git 追踪
它们属于项目级合同，不是临时缓存
仅调试 diff、health report、临时审计快照等可放入 .gitignore

8.2 覆盖规则

覆盖优先级固定为：

chapter_xxx
volume_xxx
MASTER_SETTING

但覆盖不是“静默替换”，而必须显式记录覆盖行为。

8.2.1 三层覆盖矩阵

Master / Volume / Chapter 的覆盖关系必须按字段类型区分，而不是统一“下层覆盖上层”。

字段类型	Master -> Volume	Volume -> Chapter	说明
`locked`	默认不可直接覆盖	默认不可直接覆盖	是否允许通过 `amend-*` 突破，取决于 `lock_policy`
`append_only`	可追加，不可删除	可追加，不可删除	最终值为并集
`override_allowed`	可覆盖，需记录 reason	可覆盖，需记录 reason	最终值取最近一层

补充规则：

Master.locked 对 Volume / Chapter 都生效
Volume.locked 只约束本卷下属 Chapter
Chapter 不能直接“解锁”上层已锁定字段
append_only 字段的最终值始终是 Master + Volume + Chapter 的合并结果
override_allowed 字段的最终值采用最近一层，但必须保留 override ledger

8.2.1.1 `lock_policy`

为避免把小说创作中的“合理反转”也物理锁死，所有 locked 字段都必须额外带一个 lock_policy：

system_locked
user_locked
story_locked

含义如下：

system_locked：系统 schema、基础运行约束、不可被下游合同修改
user_locked：用户明确给出的硬约束，运行时不得自动修改，只能由用户显式确认后上游修订
story_locked：当前故事系统中的核心稳定设定，不能被 Volume / Chapter 直接覆盖，但允许通过 amend-master / amend-volume proposal + 人工确认 上游改写

也就是说：

locked 仍然存在
但不是所有 locked 都是同一强度
真正允许剧情反转的出口，是“先提修订建议，再改上层合同”，而不是让 Chapter 直接冲破锁

8.2.2 冲突覆盖记录

当 chapter_xxx 或 volume_xxx 与上层合同发生冲突时，生成器必须产出显式 override 标记，而不是只保留最终值。

Markdown 层建议使用类似格式：

本章节奏：[Override 自 MASTER: 慢热蓄势 -> 极限爆发]
本章桥段：[Override 自 VOLUME: 试探对峙 -> 当场打脸]

JSON 层至少要记录：

field
base_value
override_value
source_level
reason

目的不是给人审美，而是让模型和后续脚本明确知道：

这里发生了状态切换
这是受控覆盖，不是随机漂移

8.2.3 Override Ledger 消费边界

override ledger 必须保留，但默认不应整包注入写作 prompt。

推荐分成两种消费模式：

audit/debug mode
runtime prompt mode

audit/debug mode

允许读取完整账本，用于：

dashboard 审计
合同 diff
健康检查
问题排查

runtime prompt mode

只应暴露：

当前字段的最终生效值
本章 / 本卷直接相关的 override 摘要
必要的覆盖原因短句

默认禁止：

把历史全量 override ledger 直接塞进 webnovel-write prompt
把几十章前的覆盖记录反复注入当前章节上下文

原因很简单：

这会浪费 token
会制造噪音
会让模型更关注“历史解释”而不是“当前执行约束”

8.2.4 覆盖原因字段

所有 override_allowed 字段在发生覆盖时，都应尽量附带 reason。

推荐原因标签：

ARC_ESCALATION
CHAPTER_PAYOFF
TWIST_REQUIREMENT
POV_SWITCH
CONFLICT_INTENSIFICATION

这些标签是推荐值，不是封闭枚举。

允许格式：

reason_tag + free_text
纯 free_text

没有原因的覆盖，只能视为低可信覆盖。

8.3 字段类型

字段必须被标记为三类之一：

locked
append_only
override_allowed

示例：

世界规则：locked
全局毒点：append_only
本章桥段策略：override_allowed

没有这个字段级规则，后续局部覆盖会失控。

补充规则：

若字段为 locked，则必须同时声明 lock_policy
lock_policy 未声明时，默认按 story_locked 处理，不允许静默放宽

对于 append_only 字段，还应补一条规则：

允许新增
不允许删除既有上层约束

尤其是：

anti_patterns
世界规则限制
金手指边界

这些字段一旦下层能删除上层内容，合同体系就会失去刚性。

此外必须明确 phase 1 的去重策略：

append_only 默认不做语义级自动合并
对字符串列表，去重键为规范化后的文本：
- 去首尾空白
- 折叠连续空白
- 统一常见全角/半角分隔差异
对结构化对象，去重键必须显式定义；若未定义，则保留并标记为待审计
对 anti_patterns：
- 文本完全一致时去重
- 文本不同但语义相近时，phase 1 默认同时保留
- 若上层和下层只是数值阈值不同（如 300 字 vs 200 字），不得静默删除更严格版本

也就是说，phase 1 的策略是：

宁可保留重叠项
不可静默弱化上层红线
更激进的语义去重留到后续显式规则或人工审计

8.4 持久化入口

对 skill / agent / 测试体系可见的稳定入口，必须挂到现有统一 CLI webnovel.py 下，而不是在主链里直接引入第二套平行入口。

理想态 CLI 应支持：

python -X utf8 "${SCRIPTS_DIR}/webnovel.py" --project-root "${PROJECT_ROOT}" story-system generate-master --genre "修仙退婚流"
python -X utf8 "${SCRIPTS_DIR}/webnovel.py" --project-root "${PROJECT_ROOT}" story-system generate-volume --title "拍卖会卷"
python -X utf8 "${SCRIPTS_DIR}/webnovel.py" --project-root "${PROJECT_ROOT}" story-system generate-chapter --query "拍卖会打脸"

如果保留 story_system/cli.py，它也只能作为：

开发期本地调试入口
内部封装入口

而不应成为 skill/prompt 直接依赖的外部命令。

原因：

当前项目已有统一 CLI、project_root 解析、workspace pointer、registry、prompt 完整性校验
若 story system 另起一套外部 CLI，skills、tests、dashboard、文档会立刻分叉
因此对外只保留 webnovel.py story-system ... 一条稳定入口

参数设计补充规则：

优先使用命名参数，而不是依赖带空格的位置参数
这样可以降低 PowerShell / Bash / zsh 下的转义差异
对 skill 暴露的示例命令也应遵守这个约束

此外必须预留显式合同修订入口：

python -X utf8 "${SCRIPTS_DIR}/webnovel.py" --project-root "${PROJECT_ROOT}" story-system amend-master --event "主角获得第二核心金手指"
python -X utf8 "${SCRIPTS_DIR}/webnovel.py" --project-root "${PROJECT_ROOT}" story-system amend-volume --volume 2 --event "阵营关系反转"
python -X utf8 "${SCRIPTS_DIR}/webnovel.py" --project-root "${PROJECT_ROOT}" story-system refresh-chapter --chapter 15

这类命令的职责不是“随便重算”，而是：

读取当前合同
读取运行时重大事件
只在允许变更的字段上做受控修订
记录修订原因与修订时间

8.4.1 幂等性与覆盖策略

合同生成与修订命令必须遵守幂等性规则。

`generate-*`

若目标合同不存在：创建
若目标合同已存在且输入指纹相同：直接返回现有合同，不重复覆盖
若目标合同已存在且输入指纹不同：默认拒绝静默覆盖，并提示使用：
- amend-*
- 或显式 --force-rebuild

也就是说：

generate-master 不是“无限次覆盖”
它是“首次生成 + 相同输入幂等返回”

`amend-*`

是合同的语义修订入口
用于在已有合同基础上追加或修改受控字段
不应伪装成重新生成

`--force-rebuild`

属于显式破坏性再生成
必须由调用方主动声明
执行前应先备份旧 JSON 或写入历史快照

8.4.2 phase 1 并发约束

phase 1 不应假定 .story-system/*.json 已具备复杂的多写者并发合并能力。

因此最低要求是：

generate-* / amend-* / refresh-* 对同一目标文件必须串行执行
实现上应使用文件锁或等价互斥机制
若目标已被其他进程持有写锁，应返回显式 BUSY / RETRY 错误，而不是继续写入
真正的多写者合并策略留到 day 2+ 单独设计

9. Skill Runtime Layer 设计

9.1 总原则

skill 只负责执行，不负责系统拼装。

9.2 `webnovel-init`

职责应收敛为：

理解开书意图
调用 generate-master
先落 .story-system/MASTER_SETTING.json
再渲染 .story-system/MASTER_SETTING.md
最后把结果写入设定集骨架

9.3 `webnovel-plan`

职责应收敛为：

读取 MASTER_SETTING
调用 generate-volume
调用 generate-chapter
产出卷纲、章纲、时间线

如果规划阶段发现以下事件，允许提出 amend-master / amend-volume：

新核心阵营形成
世界规则新增硬限制
金手指边界发生明确扩展
题材承诺发生结构性偏移

默认流程应为：

plan skill 识别到“可能需要修订”
调用 contract-auditor / diff analyzer 生成结构化修订建议
输出人类可读的修订摘要与受影响字段
由用户确认后再执行 amend-master / amend-volume

除非系统明确配置了自动修订策略，否则不应由 plan skill 自行改写 MASTER

它不应该再自己决定：

先读哪些题材 md
再查哪些 csv
再拼哪些规则

这些应该由 story system 统一处理。

9.4 `webnovel-write`

职责应收敛为：

读取 chapter brief
若不存在则回退 volume brief
再回退 master
读取该层级最终结算后的有效字段
只注入本章直接相关的 override 摘要
再结合 runtime memory/state/context 写正文

写作阶段默认不允许直接修改 MASTER_SETTING。

只有在检测到“重大结构事件”时，才允许通过显式 hook 进入：

amend-master
amend-volume

重大结构事件示例：

主角新增长期保留的核心能力
世界观新增不可逆规则
核心阵营关系永久翻转
主线承诺发生升级而非临时偏移

也就是说：

运行时事实可以推动合同修订
但必须通过显式修订入口
不能让 MASTER 因章节波动而持续漂移

推荐增加一个独立钩子：

contract-auditor

它的职责不是改合同，而是：

比较当前运行时事实与上层合同
判断是“临时章节偏移”还是“应升级为合同修订”
生成 amend proposal
等待用户确认

9.5 `webnovel-review`

职责应收敛为：

读取 review contract
读取 anti_patterns
按合同做结构化审查
将结果回写 review/index/state

10. 原有数据链的承接方案

这是本 spec 最关键的部分之一：不是抛弃旧数据链，而是重新定位。

10.1 `references/csv/`

新定位：

主知识层
主规则层
主检索层

10.2 `references/*.md`

新定位：

方法论层
流程规范层
审查规则层
在 CSV 覆盖度不足的阶段，仍可作为过渡期活跃知识源

10.3 `templates/genres/*.md`

新定位：

降级为“样例模板层”
可作为人工参考和初始化草稿
在 route table 覆盖度不足前，仍可作为补充题材源

10.4 `templates/output/*.md`

新定位：

升级为 story-system 的渲染模板来源

10.5 `scripts/reference_search.py`

新定位：

底层 primitive
可复用的 CSV 搜索内核
不再作为 skill 主入口

10.6 `scripts/data_modules/context_manager.py`

新定位：

运行时上下文装配器
消费 story-system contract + memory/state/index
不再负责“全局故事系统生成”

演进路径应为：

phase 1 保留 context_manager，不做平地重写
phase 1 让它优先消费 contract，同时继续聚合 state / summaries / reader_signal / plot_structure
phase 2 把其中与“全局系统生成”重叠的逻辑逐步抽到 story_system
phase 3 再把 context_manager 收敛为纯运行时上下文装配器

也就是说：

不是直接废弃
而是先接入，再抽离，再收敛

10.6.1 Contract 注入口

Day 2 以后，context_manager 必须有明确的 contract 注入口，而不是只在文档层说“合同优先”。

最小要求：

_build_pack() 读取 .story-system/ 中当前章可见的合同
pack 中新增显式 section，例如 story_contract
story_contract 的优先级高于旧的 genre_profile 摘要和临时全局拼装结果
若合同缺失，再回退到现有 genre_profile + global + reader_signal 组装链

推荐顺序：

chapter contract
volume contract
master contract
现有 genre_profile / global / references

换句话说，contract-first 必须落成真实的 pack 组装顺序，而不是停留在 skill 文本。

10.6.2 `genre_aliases.py` / `genre_profile_builder.py` / `genre-profiles.md`

这些模块和文档不是“旧包袱”，而是 route table 建设前的重要种子源。

新定位：

genre_aliases.py：继续作为题材归一化字典的现役来源
genre_profile_builder.py：继续作为复合题材 hints 的现役来源
genre-profiles.md：在 phase 1 / phase 2 期间，继续作为结构化题材参考源

它们的退出方式不应是“一刀切降级”，而应是：

先把其中稳定字段人工迁入 题材与调性推理.csv
再让 story_system 优先读 CSV、缺省回退 md
只有在 CSV 覆盖度达到阈值后，genre-profiles.md 才从主源降级为参考源

10.6.3 过渡期题材真源优先级

在 phase 1 / phase 2 期间，题材相关信息不能出现“双真源并列”。

优先级必须固定为：

.story-system 中的 contract
题材与调性推理.csv
genre-profiles.md
templates/genres/*.md

约束：

一旦 contract 已存在，context_manager 不得再独立输出与 contract 冲突的题材结论
genre-profiles.md 在过渡期只能作为回退源或补充说明源
templates/genres/*.md 在过渡期只能作为样例/补充题材源

否则就会出现：

contract 说 A
context pack 仍在塞 B
skill 最终又混用了 C

这会直接破坏 contract-first 目标

10.7 `state.json`

新定位：

写作过程状态机
角色当前状态
章节推进状态

它不是故事总设定中心。

10.8 `index.db / vectors / bm25`

新定位：

运行期检索证据层
剧情事实回溯层
不是规则知识层

10.9 `memory_contract / orchestrator / summaries`

新定位：

长期记忆层
已发生事实层
伏笔与回收跟踪层

这一层与 CSV 的关系应为：

CSV 给规则
memory 给事实
story_system 负责把规则和事实一起装进合同

10.9.1 Memory 最低可用标准

理想态合同系统不能假设 memory 所有子模块都已经工业化完成。

phase 1 的最低事实输入标准应为：

state.json
最近章节摘要
index.db 中可直接读取的实体、关系、状态变化

MemoryOrchestrator 可作为增强项，但不是 phase 1 的硬依赖。

如果 memory 子系统某些组件不可用，合同系统的降级策略应为：

继续生成规则合同
对事实合同降级为“state + summaries + index facts”
不因 memory 半成品状态阻断 generate-master / generate-volume

10.10 迁移阶段划分

这部分虽然是理想态 spec，也需要给出最基本的迁移判断标准。

Day 1 变更

新增 题材与调性推理.csv
新增最小 generate-master
保留现有 reference_search.py
保留现有 context_manager
保留 genre-profiles.md 作为活跃题材源
skill 继续按 2026-04-09 的 L0/L1/L2 策略运行
story-system 先以内核模块存在，不强制对 skill 暴露
若提供 CLI，仅先以 webnovel.py story-system ... 形式接入统一入口

Day 2 变更

引入 Volume 层合同
skill 改为“合同优先 + 局部 reference 按需加载”
genre-profiles.md 仍可作为回退源，不应提前降级
context_manager 正式注入 story_contract
dashboard / preflight / health / backup 开始识别 .story-system

Day 3 及以后

在满足知识密度阈值后，templates/genres/*.md 逐步退出主链
reference_search.py 只作为底层 primitive
story_system 成为技能层的唯一系统入口

10.10.1 知识密度切换阈值

在以下条件满足前，不应把 genre-profiles.md 和 templates/genres/*.md 提前降级：

题材与调性推理.csv 已覆盖当前系统支持的主流主题材
genre_aliases.py 中的高频别名能在 route table 中找到稳定归一化目标
init / plan / write 的代表性题材输入，经人工抽样验证后，大部分可以直接由 CSV + contract 生成可用结果
对当前活跃题材家族，至少已有一轮真实项目验证，而不是只靠静态录入

简单说：

不是 CSV 一出现就替换 md
而是 CSV 达到“可稳定承接主链”的知识密度后，才逐步切换

10.10.2 Contract 接管边界

Day 2 以后，contract 应优先接管：

题材调性
毒点红线
全局系统边界
卷级 / 章级执行目标

继续由 step-bound reference 保留：

局部写作技法
局部场景模式
命名与语汇
润色、排版、anti-ai、review schema

运行时还必须补一条：

context_manager 和 webnovel-write 默认读取最终结算态合同
完整 override ledger 只在 debug / dashboard / health report 中默认展开

10.11 `scripts/data_modules/config.py`

当前 DataModulesConfig 已经是项目级事实上的统一配置入口，覆盖：

路径
检索参数
上下文预算
memory / index / review 相关调优

理想态 story_system 不应再平行发明第二套完全独立的配置树。

推荐策略：

phase 1 直接复用 DataModulesConfig
新增配置统一采用 story_system_* 命名空间
若后续单独拆出 StorySystemConfig，也应只是 DataModulesConfig 的薄包装或子视图，而不是完全分家

必须避免的反模式：

一套配置给 runtime 用
另一套配置给 story system 用
两边字段重名但语义不同

那样会让 contract、context、memory 三条链路重新分叉。

10.12 `.story-system` 的运维接入

既然 .story-system 被定义为新的持久化真源，它就不能处于现有运维链路的盲区。

至少需要接入以下四类系统：

preflight

在 Day 2 以后，preflight 至少应增加：

.story-system/MASTER_SETTING.md 是否存在
.story-system/MASTER_SETTING.json 是否存在
JSON 合同是否可读

dashboard / watcher

dashboard 不应只监听 .webnovel/。

至少还应关注：

.story-system/MASTER_SETTING.*
.story-system/volumes/*.json
.story-system/chapters/*.json

否则合同变更后，前端不会刷新。

health / status report

状态报告不应只覆盖 .webnovel/state.json 和现有运行时数据。

还应增加：

合同存在性检查
合同新鲜度检查
override ledger 摘要
contract / state 是否明显冲突的健康提醒

backup / fallback backup

Git 模式下通常天然覆盖 .story-system/，但本地降级备份也必须覆盖它。

最低要求：

Git 不可用时，fallback backup 不能只备份 .webnovel/state.json
至少应同时备份 .story-system/ 的当前合同文件

否则恢复点会丢失新的系统真源。

11. 旧模块去留决策

11.1 保留并降级

以下模块保留，但降级为下层能力：

reference_search.py
query_router.py
context_manager.py
genre_aliases.py
genre_profile_builder.py

其中：

context_manager.py 更准确的路径是“保留并演进后收敛”
genre_aliases.py / genre_profile_builder.py 更准确的路径是“保留并迁移其知识到 route table”

11.2 保留并重定位

以下目录保留，但职责改变：

references/csv/
references/shared/
references/outlining/
templates/output/

11.3 保留但不再担任主源

以下内容继续保留，但不再是主系统输入：

references/genre-profiles.md
templates/genres/*.md

11.4 应新增的一线模块

理想态应新增：

story_system/engine/search_engine.py
story_system/engine/reasoning_engine.py
story_system/engine/aggregator.py
story_system/engine/anti_pattern_engine.py
story_system/engine/contract_builder.py
story_system/engine/renderer.py
story_system/engine/persistence.py

12. Anti-Patterns 统一机制

12.1 统一原则

理想态不要求所有旧表立即统一字段名，但要求 story system 统一抽取。

12.2 建议映射

ANTI_PATTERN_SOURCE_FIELDS = {
    "题材与调性推理": ["强制禁忌/毒点"],
    "人设与关系": ["忌讳写法"],
    "爽点与节奏": ["常见崩盘误区"],
    "场景写法": ["反面写法"],
    "写作技法": ["常见误区"],
    "桥段套路": ["忌讳写法"],
}

说明：

若 phase 1 按 retrofit spec 为 桥段套路.csv 新增了 忌讳写法 列，phase 2 必须继续读取该列，避免两份 spec 再次分叉
桥段套路.反套路变种 是变体灵感来源，不默认纳入 anti-pattern 聚合
金手指与设定.数值控制边界 属于 system_constraints，不应直接等同于 anti-pattern
只有显式负面字段，才进入 ANTI_PATTERN_SOURCE_FIELDS

12.3 输出要求

所有生成合同中，必须存在醒目的：

## Anti-Patterns

该区块是不可逾越的硬红线。

13. 运行时工作流

13.1 开书阶段

输入：

写个赛博朋克黑客流

流程：

reasoning engine 锁定主辅题材
多域聚合基础表
生成 MASTER_SETTING
写入 .story-system/
初始化设定集

13.2 规划阶段

输入：

规划第一卷拍卖会逆袭

流程：

读取 MASTER
聚合桥段、节奏、场景、人设补充
生成 VOLUME_BRIEF
再拆 CHAPTER_BRIEF

13.3 写作阶段

输入：

写第 15 章

流程：

读取 chapter_015
若不存在则回退 volume
再回退 master
读取该层级最终结算后的有效字段
只注入本章直接相关的 override 摘要，而不是完整历史账本
结合 state / memory / recent context 起草正文

13.4 审查阶段

输入：

审查第 15 章

流程：

读取 review contract
读取 anti_patterns
结合 review schema 输出结构化问题

14. 测试与验证策略

14.1 总原则

这个 CSV 数据库不需要做“每条知识点一个测试”的重型方案。

测试只需要覆盖：

合同生成是否成功
覆盖规则是否正确
关键字段是否落地
anti-pattern 是否被聚合
runtime 是否能读取合同

14.2 不建议的测试

不建议：

为每个 CSV 条目写测试
为每个知识点写断言
为内容语义质量写机械化单测

14.3 应保留的验证

建议保留：

reasoning 命中 smoke test
contract schema test
persistence 覆盖规则 test
CLI 生成最小链路 test

建议额外补两类低成本高价值验证：

多标签推理融合 test
override ledger 生成 test
JSON -> Markdown 渲染一致性 test
locked + lock_policy 行为 test

验证重点不是“知识点对不对”，而是：

合同结构稳不稳定
多标签毒点是否并集
覆盖是否有显式记录
JSON 是否通过 schema 校验

15. 实施约束

15.1 知识迁移约束

知识迁移必须人工完成。

禁止：

自动抽取 md 为 csv
自动翻译后批量入库
自动拆句生成知识条目

允许：

人工阅读旧资料
人工提炼摘要、关键词、同义词
人工翻译英文 prompt 后录入

15.2 工程实现约束

工程层可以写脚本、CLI、渲染器、聚合器、持久化模块。

禁止脚本迁移，不等于禁止工程脚本开发。

16. 最终架构决策

本 spec 给出的理想态决策如下：

references/csv 升级为主知识仓
references/*.md 保留为方法论层
templates/genres 降级为样例模板层
templates/output 升级为合同模板层
reference_search.py 退出一线，降级为底层 primitive
genre-profiles.md 退出核心配置中心，职责转入结构化 reasoning 数据
skills/webnovel-* 改为“contract 优先 + 局部 step-bound reference 按需加载”
state / index / memory 继续保留，作为运行时事实与证据层
story_system 对外只通过统一 CLI webnovel.py story-system ... 暴露稳定入口
.story-system 必须接入 preflight / dashboard / health / backup，不能成为运维盲区
.story-system/*.json 是唯一真理源，*.md 只是只读渲染产物
reasoning engine 采用 L0 / L1 / L2，由确定性路由保底、LLM 负责低置信语义融合
locked 字段必须带 lock_policy，剧情级核心设定的变更只能走 amend proposal + 用户确认

17. 结语

这次重构真正要完成的，不是“把参考资料查得更准一点”。

真正的目标是：

不再让模型每一章都从散资料临时拼世界
而是先建立一个稳定的故事系统
再让规划、写作、审查都机械地服从这个系统

这就是 webnovel-writer 从“离散检索工具”升级为“系统级智能写作底座”的关键跃迁。

2026-04-12-webnovel-story-intelligence-system-spec.md 51 KB Permalink Verlauf Originalformat

Webnovel Writer Story Intelligence System 理想态重构 Spec

1. 文档定位

1.1 这份 spec 解决什么问题

1.2 与现有 spec 的关系

1.2.1 与 retrofit spec 的复用 / 替代边界

可直接复用的部分

本 spec 对 retrofit 的超集扩展

本 spec 对 retrofit 的替代决策

1.3 借鉴对象

2. 设计结论

2.1 一句话结论

2.2 核心判断

判断 1：CSV 应成为主知识层

判断 2：MD 应降级为方法论层

判断 3：skill 不应再直接读散乱 reference

判断 4：原有 data_modules 不是废弃，而是下沉为运行时底盘

2.3 Contract 与渐进式披露的分工

由 contract 优先承接的内容

继续由按需 reference 承接的内容

3. 目标与非目标

3.1 目标

3.2 非目标

3.3 知识迁移边界

4. 理想态总架构

4.1 总体分层

4.2 分层关系

4.3 推荐目录

4.4 初始实现颗粒度

5. Reasoning Layer 设计

5.1 职责

5.2 核心数据表

5.3 建议字段

5.4 题材推理原则

5.5 多标签推理规则

5.6 Reasoning Engine 实现边界

L0：确定性路由

L1：确定性融合

L2：LLM 分类 / 融合

6. Knowledge Layer 设计

6.1 知识分层

6.2 Reasoning Tables

6.3 Rule Tables

6.4 Methodology Docs

7. Contract Layer 设计

7.1 核心思想

7.2 合同类型

7.3 每类合同的职责

MASTER_SETTING

VOLUME_BRIEF

CHAPTER_BRIEF

ANTI_PATTERNS

REVIEW_CONTRACT

7.4 双产物要求与单一真理源

7.4.1 与 Retrofit Spec 的 Markdown 迁移裁决

phase 1

phase 2 及以后

7.5 JSON 合同校验

7.5.1 Schema Version 与兼容策略

7.6 合同 JSON 基线

MASTER_SETTING.json

VOLUME_BRIEF.json

CHAPTER_BRIEF.json

REVIEW_CONTRACT.json

7.6.1 StorySystemDict 到合同家族的映射

8. Persistence Layer 设计

8.1 目录规范

8.1.1 ANTI_PATTERNS 独立文件与各级合同的关系

8.1.2 命名与版本控制约束

8.2 覆盖规则

8.2.1 三层覆盖矩阵

8.2.1.1 lock_policy

8.2.2 冲突覆盖记录

8.2.3 Override Ledger 消费边界

audit/debug mode

runtime prompt mode

8.2.4 覆盖原因字段

8.3 字段类型

8.4 持久化入口

8.4.1 幂等性与覆盖策略

2026-04-12-webnovel-story-intelligence-system-spec.md 51 KB

Permalink Verlauf Originalformat

`MASTER_SETTING.json`

`VOLUME_BRIEF.json`

`CHAPTER_BRIEF.json`

`REVIEW_CONTRACT.json`

7.6.1 `StorySystemDict` 到合同家族的映射

8.1.1 `ANTI_PATTERNS` 独立文件与各级合同的关系

8.2.1.1 `lock_policy`

`generate-*`

`amend-*`

`--force-rebuild`

9.2 `webnovel-init`

9.3 `webnovel-plan`

9.4 `webnovel-write`

9.5 `webnovel-review`

10.1 `references/csv/`

10.2 `references/*.md`

10.3 `templates/genres/*.md`

10.4 `templates/output/*.md`

10.5 `scripts/reference_search.py`

10.6 `scripts/data_modules/context_manager.py`

10.6.2 `genre_aliases.py` / `genre_profile_builder.py` / `genre-profiles.md`

10.7 `state.json`

10.8 `index.db / vectors / bm25`

10.9 `memory_contract / orchestrator / summaries`

10.11 `scripts/data_modules/config.py`

10.12 `.story-system` 的运维接入