Quellcode durchsuchen

optimize SKILL.md: dim3失败模式——if-then三段式降级表(并行降串行/分Phase续跑/成本档位) 编码issue#27/#46/#11实证失败

Co-Authored-By: Claude Fable 5 <noreply@anthropic.com>
alchain vor 1 Tag
Ursprung
Commit
dbff621811
1 geänderte Dateien mit 20 neuen und 5 gelöschten Zeilen
  1. 20 5
      SKILL.md

+ 20 - 5
SKILL.md

@@ -48,8 +48,15 @@ description: |
 3. **用途**:思维顾问?决策参考?角色扮演?
 4. **新建 or 更新**:是否已有该人物的Skill?(检查 `.claude/skills/` 目录)
 5. **本地语料**:「你手上有没有这个人的一手素材?比如书籍PDF、演讲/访谈transcript、视频字幕、个人博客导出等。有的话直接丢给我,比网上搜的质量高得多。」
+6. **蒸馏档位**:告知用户成本量级并确认档位。完整蒸馏是多agent+多轮搜索的长任务,顶级模型单次可消耗数十美元(真实用户案例),必须在开跑前说清楚:
 
-用户说「就做XX」没有更多信息 → 默认全面画像 + 思维顾问 + 无本地语料(走网络搜索),直接推进。
+| 档位 | 调研规模 | 适用场景 | 成本量级 |
+|------|---------|---------|---------|
+| 快速 | 3个维度(著作+对话+表达),每维度限5个来源 | 先试试效果 / 冷门人物 / 预算敏感 | 约标准档1/3 |
+| 标准(默认) | 6个维度完整调研 | 大多数场景 | 中等;换更轻量模型可显著降低 |
+| 深度 | 6维度 + 一手素材全量下载(书籍/字幕/长文存档) | 打算开源发布的精品Skill | 最高 |
+
+用户说「就做XX」没有更多信息 → 默认全面画像 + 思维顾问 + 无本地语料(走网络搜索)+ 标准档,直接推进。
 用户提供了本地语料 → 标记为**本地语料模式**,Phase 1的采集策略会相应调整。
 
 确认后 → 跳到 Phase 0.5。
@@ -303,11 +310,19 @@ Phase 1启动前,**主动扫描 `.claude/skills/` 目录**,检查是否有
 
 中文渠道只接受权威媒体:36氪、极客公园、晚点LatePost、财新、第一财经、虎嗅、少数派、机器之心等。人物访谈类可用播客平台(小宇宙、喜马拉雅原始音频)和B站原始视频(非搬运号)。
 
-#### Agent超时与失败处理
+#### 失败模式与降级路径(if-then速查表)
+
+蒸馏是长流程+多agent+联网任务,下表前三条都在真实用户中发生过(GitHub issue实证)。每条按「触发条件 → 一线修复 → 仍失败兜底」执行:
 
-- **单个Agent超时**(搜索5分钟无有价值结果):不等待,继续推进。在Phase 2中标注「信息不足」,在诚实边界中说明
-- **信息源匮乏**(<10条可用来源):Phase 0.5就提醒用户,降低期望(心智模型减至2-3个),增加诚实边界篇幅
-- **Agent结果冲突**:保留矛盾——矛盾本身是有价值的信号。用「内在张力」section收录
+| 触发条件 | 一线修复 | 仍失败兜底 |
+|---------|---------|-----------|
+| 运行环境不支持并行subagent/后台任务(部分runtime会在Phase 1挂起死等) | 6个调研任务降级为**串行执行**:做完一个落盘一个,禁止挂起等待后台通知 | 单agent分6轮调研,每轮只做一个维度并立即落盘 |
+| 上下文窗口不足(单次完整蒸馏可累积500k+ token,200k窗口模型跑不完) | 分Phase续跑:每个Phase结束即把状态写入 `references/research/`,新会话从文件恢复(调研文件本身就是断点) | 200k窗口模型分3段会话跑:Phase 0-1 / Phase 1.5-2.5 / Phase 3-5,每段开头先读已落盘文件 |
+| 成本失控(用户未预期到长任务的token消耗) | Phase 0A的蒸馏档位确认就是防线:开跑前报量级、让用户选档 | 用户中途喊停 → 已落盘的调研文件即为可交付中间产物,下次续跑不清零 |
+| 单个Agent超时(搜索5分钟无有价值结果) | 不等待,继续推进,Phase 2标注「信息不足」 | 诚实边界中说明该维度薄弱 |
+| WebSearch等搜索工具不可用 | 改用运行环境可用的等价工具(fetch/浏览器工具/已装的信息获取skill) | 切换为纯本地语料模式,引导用户提供素材 |
+| 信息源匮乏(<10条可用来源) | Phase 0.5就提醒用户,降低期望(心智模型减至2-3个) | 增加诚实边界篇幅,标注推测成分 |
+| Agent结果冲突 | 保留矛盾——矛盾本身是有价值的信号 | 用「内在张力」section收录 |
 
 **关键规则**:宁可生成一个诚实标注了局限的60分Skill,也不要生成一个看起来完美但实际上在编造的90分Skill。