|
@@ -47,8 +47,10 @@ description: |
|
|
|
2. **聚焦方向**(可选):全面画像 vs 聚焦某个维度?
|
|
2. **聚焦方向**(可选):全面画像 vs 聚焦某个维度?
|
|
|
3. **用途**:思维顾问?决策参考?角色扮演?
|
|
3. **用途**:思维顾问?决策参考?角色扮演?
|
|
|
4. **新建 or 更新**:是否已有该人物的Skill?(检查 `.claude/skills/` 目录)
|
|
4. **新建 or 更新**:是否已有该人物的Skill?(检查 `.claude/skills/` 目录)
|
|
|
|
|
+5. **本地语料**:「你手上有没有这个人的一手素材?比如书籍PDF、演讲/访谈transcript、视频字幕、个人博客导出等。有的话直接丢给我,比网上搜的质量高得多。」
|
|
|
|
|
|
|
|
-用户说「就做XX」没有更多信息 → 默认全面画像 + 思维顾问,直接推进。
|
|
|
|
|
|
|
+用户说「就做XX」没有更多信息 → 默认全面画像 + 思维顾问 + 无本地语料(走网络搜索),直接推进。
|
|
|
|
|
+用户提供了本地语料 → 标记为**本地语料模式**,Phase 1的采集策略会相应调整。
|
|
|
|
|
|
|
|
确认后 → 跳到 Phase 0.5。
|
|
确认后 → 跳到 Phase 0.5。
|
|
|
|
|
|
|
@@ -149,7 +151,7 @@ description: |
|
|
|
│ ├── 04-external-views.md # 他者视角与批评
|
|
│ ├── 04-external-views.md # 他者视角与批评
|
|
|
│ ├── 05-decisions.md # 决策记录与行动
|
|
│ ├── 05-decisions.md # 决策记录与行动
|
|
|
│ └── 06-timeline.md # 人物时间线
|
|
│ └── 06-timeline.md # 人物时间线
|
|
|
- └── sources/ # 下载的一手素材
|
|
|
|
|
|
|
+ └── sources/ # 一手素材(用户提供 + 网络下载)
|
|
|
├── books/
|
|
├── books/
|
|
|
├── transcripts/
|
|
├── transcripts/
|
|
|
└── articles/
|
|
└── articles/
|
|
@@ -159,6 +161,7 @@ description: |
|
|
|
- [ ] 目录已创建
|
|
- [ ] 目录已创建
|
|
|
- [ ] 如果是中国人物:信息源策略切换为B站原始视频/小宇宙播客/权威中文媒体优先(知乎和微信公众号始终排除,见信息源黑名单)
|
|
- [ ] 如果是中国人物:信息源策略切换为B站原始视频/小宇宙播客/权威中文媒体优先(知乎和微信公众号始终排除,见信息源黑名单)
|
|
|
- [ ] 如果是更新模式:已读取现有SKILL.md,标注哪些信息需要刷新
|
|
- [ ] 如果是更新模式:已读取现有SKILL.md,标注哪些信息需要刷新
|
|
|
|
|
+- [ ] 如果用户提供了本地语料:将素材复制/移动到 `sources/` 对应子目录,标记为**本地语料模式**
|
|
|
|
|
|
|
|
**关键规则**:
|
|
**关键规则**:
|
|
|
- 每个subagent必须把调研结果写入对应的md文件。不存文件的调研等于没做。
|
|
- 每个subagent必须把调研结果写入对应的md文件。不存文件的调研等于没做。
|
|
@@ -168,6 +171,41 @@ description: |
|
|
|
|
|
|
|
|
### Phase 1: 多源信息采集(并行Agent Swarm)
|
|
### Phase 1: 多源信息采集(并行Agent Swarm)
|
|
|
|
|
|
|
|
|
|
+#### 模式判断:本地语料 vs 网络搜索
|
|
|
|
|
+
|
|
|
|
|
+根据Phase 0A的结果,选择对应的采集策略:
|
|
|
|
|
+
|
|
|
|
|
+| 模式 | 触发条件 | 策略 |
|
|
|
|
|
+|------|---------|------|
|
|
|
|
|
+| **纯网络搜索**(默认) | 用户没有提供本地素材 | 6个Agent全部走网络搜索,完整流程 |
|
|
|
|
|
+| **本地语料优先** | 用户提供了PDF/transcript/字幕/文章等 | 先分析本地素材,网络搜索变为补充 |
|
|
|
|
|
+| **纯本地语料** | 用户明确说「只用我给的素材」或蒸馏非公众人物 | 只分析本地素材,不做网络搜索 |
|
|
|
|
|
+
|
|
|
|
|
+**本地语料优先模式的执行逻辑**:
|
|
|
|
|
+
|
|
|
|
|
+1. **先读本地素材**:将用户提供的文件按6个维度分类(一本书可能同时覆盖著作+对话+表达多个维度)
|
|
|
|
|
+2. **识别信息缺口**:本地素材覆盖了哪些维度?哪些维度缺失或薄弱?
|
|
|
|
|
+3. **定向补充搜索**:只对缺失维度启动网络搜索Agent,已有充足本地素材的维度跳过搜索
|
|
|
|
|
+4. **来源标记**:调研文件中明确区分「来自用户提供素材」vs「来自网络搜索」
|
|
|
|
|
+
|
|
|
|
|
+**本地素材的常见形式及处理方式**:
|
|
|
|
|
+
|
|
|
|
|
+| 素材类型 | 处理方式 | 覆盖维度 |
|
|
|
|
|
+|---------|---------|---------|
|
|
|
|
|
+| 书籍PDF | 直接阅读提取核心论点 | 著作(01)、表达(03) |
|
|
|
|
|
+| 演讲/访谈transcript | 分析问答模式和即兴反应 | 对话(02)、表达(03) |
|
|
|
|
|
+| 视频字幕SRT | 同transcript处理 | 对话(02)、表达(03) |
|
|
|
|
|
+| 博客/newsletter导出 | 提取系统性观点 | 著作(01)、表达(03) |
|
|
|
|
|
+| 社交媒体导出 | 分析碎片表达模式 | 表达(03) |
|
|
|
|
|
+| 内部文档/备忘录 | 分析决策逻辑 | 决策(05) |
|
|
|
|
|
+| 用户整理的笔记 | 作为二手来源交叉参考 | 视具体内容 |
|
|
|
|
|
+
|
|
|
|
|
+**本地语料的质量优势**:用户手上的一手素材(尤其是完整书籍、长访谈原文)通常比网络搜索到的二手转述质量高得多。在信息源优先级中,本地提供的一手素材排在最高权重。
|
|
|
|
|
+
|
|
|
|
|
+---
|
|
|
|
|
+
|
|
|
|
|
+以下是6个Agent的标准任务分配(纯网络搜索模式,或本地语料模式中缺失维度的补充搜索):
|
|
|
|
|
+
|
|
|
启动6个并行subagent,每个负责不同信息维度。
|
|
启动6个并行subagent,每个负责不同信息维度。
|
|
|
|
|
|
|
|
#### 6个Agent的任务分配
|
|
#### 6个Agent的任务分配
|
|
@@ -214,13 +252,41 @@ spawn subagent时,用以下结构给任务(以Agent 1著作为例):
|
|
|
|
|
|
|
|
#### 工具辅助(如可用)
|
|
#### 工具辅助(如可用)
|
|
|
- 书籍:Z-Library/LibGen搜索下载 → 存入 `sources/books/`
|
|
- 书籍:Z-Library/LibGen搜索下载 → 存入 `sources/books/`
|
|
|
-- 视频:yt-dlp下载字幕 → 存入 `sources/transcripts/`
|
|
|
|
|
|
|
+- 视频字幕获取(已提供脚本,直接调用):
|
|
|
|
|
+ - **Step 1 下载字幕**:`bash [skill目录]/references/download_subtitles.sh <YouTube_URL> [输出目录]`
|
|
|
|
|
+ - 自动优先人工字幕 → 中文 → 英文 → 自动生成字幕
|
|
|
|
|
+ - 输出SRT/VTT文件到指定目录
|
|
|
|
|
+ - **Step 2 清洗为纯文本**:`python3 [skill目录]/references/srt_to_transcript.py <input.srt> [output.txt]`
|
|
|
|
|
+ - 去时间戳、序号、HTML标签、连续重复行
|
|
|
|
|
+ - 输出干净的可阅读transcript → 存入 `sources/transcripts/`
|
|
|
|
|
+ - 用户提供本地视频文件(无字幕):用 gemini-video skill 转写
|
|
|
- 播客:搜索transcript网站(podcastnotes.org等)
|
|
- 播客:搜索transcript网站(podcastnotes.org等)
|
|
|
|
|
+- 调研摘要生成(Phase 1.5用):`python3 [skill目录]/references/merge_research.py <skill目录>`
|
|
|
|
|
+ - 自动扫描 `references/research/01-06.md`,统计来源数、一手/二手占比、关键发现
|
|
|
|
|
+ - 输出Phase 1.5检查点的markdown表格,无需手动统计
|
|
|
|
|
+- 质量自检(Phase 4用):`python3 [skill目录]/references/quality_check.py <SKILL.md路径>`
|
|
|
|
|
+ - 自动检查6项通过标准:心智模型数量、局限性、表达DNA、诚实边界、内在张力、一手来源占比
|
|
|
|
|
+ - 输出逐项PASS/FAIL和总结
|
|
|
|
|
+
|
|
|
|
|
+#### 利用已安装的信息获取Skill
|
|
|
|
|
+
|
|
|
|
|
+Phase 1启动前,**主动扫描 `.claude/skills/` 目录**,检查是否有可用于信息获取的skill。如果有,在调研中优先调用,比WebSearch更稳定高效:
|
|
|
|
|
+
|
|
|
|
|
+| 已安装Skill | 用途 | 调用场景 |
|
|
|
|
|
+|------------|------|---------|
|
|
|
|
|
+| `gemini-video` | 分析本地视频文件,提取transcript | 用户提供了视频文件但没有字幕 |
|
|
|
|
|
+| `web-article-reader` | 精确读取网页文章全文 | 找到重要文章URL时,精确提取而非依赖搜索摘要 |
|
|
|
|
|
+| `agent-reach` | 多渠道信息获取(17个平台) | 需要从X/Reddit/YouTube等平台获取信息 |
|
|
|
|
|
+| `huashu-research` | 结构化深度调研 | 需要对某个维度做深度调研而非广撒网 |
|
|
|
|
|
+| `pdf` | 读取PDF书籍/论文 | 用户提供了PDF格式的一手素材 |
|
|
|
|
|
+
|
|
|
|
|
+**执行方式**:在spawn subagent时,把可用skill的名称和用途告知agent,让agent在调研中按需调用。这比让agent自己用WebSearch摸索效率高得多。
|
|
|
|
|
|
|
|
#### 信息源优先级
|
|
#### 信息源优先级
|
|
|
|
|
|
|
|
| 来源类型 | 揭示什么 | 权重 |
|
|
| 来源类型 | 揭示什么 | 权重 |
|
|
|
|---------|---------|------|
|
|
|---------|---------|------|
|
|
|
|
|
+| **用户提供的一手素材** | 完整原文,未经二手过滤 | **最高+** |
|
|
|
| 本人著作 | 系统性思考 | 最高 |
|
|
| 本人著作 | 系统性思考 | 最高 |
|
|
|
| 长对话/访谈 | 即兴思维过程 | 最高 |
|
|
| 长对话/访谈 | 即兴思维过程 | 最高 |
|
|
|
| 实际决策记录 | 真实行为 vs 声称 | 最高 |
|
|
| 实际决策记录 | 真实行为 vs 声称 | 最高 |
|
|
@@ -357,6 +423,7 @@ Phase 2提炼完成后,暂停展示提炼摘要给用户确认:
|
|
|
|------------|---------|
|
|
|------------|---------|
|
|
|
| frontmatter description | 来源数量+模型数量+触发词 |
|
|
| frontmatter description | 来源数量+模型数量+触发词 |
|
|
|
| 角色扮演规则 | 直接使用模板默认规则,不需要改 |
|
|
| 角色扮演规则 | 直接使用模板默认规则,不需要改 |
|
|
|
|
|
+| **回答工作流(Agentic Protocol)** | **根据心智模型自动推导,详见下方生成指引** |
|
|
|
| 身份卡 | 时间线(06) + 著作(01) → 用此人语气写50字自我介绍 |
|
|
| 身份卡 | 时间线(06) + 著作(01) → 用此人语气写50字自我介绍 |
|
|
|
| 心智模型 | Phase 2.1 提取结果,每个含名称/证据/应用/局限 |
|
|
| 心智模型 | Phase 2.1 提取结果,每个含名称/证据/应用/局限 |
|
|
|
| 决策启发式 | Phase 2.2 提取结果,每条含场景+案例 |
|
|
| 决策启发式 | Phase 2.2 提取结果,每条含场景+案例 |
|
|
@@ -368,6 +435,64 @@ Phase 2提炼完成后,暂停展示提炼摘要给用户确认:
|
|
|
| 调研来源 | 6个Agent的引用汇总,分一手/二手 |
|
|
| 调研来源 | 6个Agent的引用汇总,分一手/二手 |
|
|
|
| 创建者归属 | 固定内容:`> 本Skill由 [女娲 · Skill造人术](https://github.com/alchaincyf/nuwa-skill) 生成` + `> 创建者:[花叔](https://x.com/AlchainHust)` |
|
|
| 创建者归属 | 固定内容:`> 本Skill由 [女娲 · Skill造人术](https://github.com/alchaincyf/nuwa-skill) 生成` + `> 创建者:[花叔](https://x.com/AlchainHust)` |
|
|
|
|
|
|
|
|
|
|
+#### 回答工作流(Agentic Protocol)生成指引
|
|
|
|
|
+
|
|
|
|
|
+**为什么需要这个段落**:让人物不只是「说得像」,还「做得像」。没有这个段落,人物Skill遇到需要事实的问题时会凭训练语料编造,而不是像真人一样先做功课再发言。这是人物Skill从「鹦鹉学舌」升级为「可靠思维顾问」的关键。
|
|
|
|
|
+
|
|
|
|
|
+**位置**:放在「角色扮演规则」之后、「示例对话」之前。
|
|
|
|
|
+
|
|
|
|
|
+**生成规则**:
|
|
|
|
|
+
|
|
|
|
|
+生成的Agentic Protocol必须包含以下3个Step,其中Step 2的研究维度必须**根据蒸馏出的心智模型自动推导**,不是固定模板:
|
|
|
|
|
+
|
|
|
|
|
+```markdown
|
|
|
|
|
+## 回答工作流(Agentic Protocol)
|
|
|
|
|
+
|
|
|
|
|
+**核心原则:[人物名]不凭感觉说话。遇到需要事实支撑的问题时,先做功课再回答。**
|
|
|
|
|
+
|
|
|
|
|
+### Step 1: 问题分类
|
|
|
|
|
+
|
|
|
|
|
+收到问题后,先判断类型:
|
|
|
|
|
+
|
|
|
|
|
+| 类型 | 特征 | 行动 |
|
|
|
|
|
+|------|------|------|
|
|
|
|
|
+| **需要事实的问题** | 涉及具体公司/人物/事件/产品/市场现状 | → 先研究再回答(Step 2) |
|
|
|
|
|
+| **纯框架问题** | 抽象价值观、思维方式、人生建议 | → 直接用心智模型回答(跳到Step 3) |
|
|
|
|
|
+| **混合问题** | 用具体案例讨论抽象道理 | → 先获取案例事实,再用框架分析 |
|
|
|
|
|
+
|
|
|
|
|
+**判断原则**:如果回答质量会因为缺少最新信息而显著下降,就必须先研究。宁可多搜一次,也不要凭训练语料编造。
|
|
|
|
|
+
|
|
|
|
|
+### Step 2: [人物名]式研究(按问题类型选择)
|
|
|
|
|
+
|
|
|
|
|
+**⚠️ 必须使用工具(WebSearch等)获取真实信息,不可跳过。**
|
|
|
|
|
+
|
|
|
|
|
+[根据此人的心智模型和分析偏好,生成3-5个研究维度分类,每个分类下列出4-6个具体研究点]
|
|
|
|
|
+
|
|
|
|
|
+#### 研究输出格式
|
|
|
|
|
+研究完成后,先在内部整理事实摘要(不输出给用户),然后进入Step 3。
|
|
|
|
|
+用户看到的不是调研报告,而是[人物名]基于真实信息做出的判断。
|
|
|
|
|
+
|
|
|
|
|
+### Step 3: [人物名]式回答
|
|
|
|
|
+
|
|
|
|
|
+基于Step 2获取的事实(如有),运用心智模型和表达DNA输出回答。
|
|
|
|
|
+```
|
|
|
|
|
+
|
|
|
|
|
+**Step 2研究维度的推导方法**:
|
|
|
|
|
+
|
|
|
|
|
+从蒸馏出的心智模型反推此人分析问题时最关注什么,将其转化为具体的搜索维度。举例:
|
|
|
|
|
+
|
|
|
|
|
+| 人物 | 核心心智模型 | → 推导出的研究维度 |
|
|
|
|
|
+|------|------------|------------------|
|
|
|
|
|
+| 芒格 | 多元思维模型、逆向思考、激励机制 | → 看护城河、看管理层激励结构、看最大风险(逆向)、看历史类比 |
|
|
|
|
|
+| 费曼 | 第一性原理、对权威的怀疑 | → 看基本物理/数学约束、看官方说法的逻辑漏洞、看实验数据 |
|
|
|
|
|
+| 塔勒布 | 反脆弱、尾部风险、知识的僭妄 | → 看极端情况、看谁在承担尾部风险、看专家预测的历史记录 |
|
|
|
|
|
+| MrBeast | 注意力工程、测试迭代 | → 看竞品数据(播放/互动)、看标题/缩略图的A/B测试空间、看受众画像 |
|
|
|
|
|
+
|
|
|
|
|
+**关键约束**:
|
|
|
|
|
+- 研究维度必须来自心智模型,不能是通用的「搜索相关信息」
|
|
|
|
|
+- 每个维度要有具体的搜索指引(搜什么、看什么数据),不能只是抽象描述
|
|
|
|
|
+- 按问题类型分组(如芒格分「看公司」「看人物」「看事件」),让Skill使用者能快速定位
|
|
|
|
|
+
|
|
|
#### Step 3: 质量自检
|
|
#### Step 3: 质量自检
|
|
|
构建完成后,读取 `references/extraction-framework.md` 末尾的「质量自检清单」,逐项检查。不通过的项标注出来,回到对应Phase修复。
|
|
构建完成后,读取 `references/extraction-framework.md` 末尾的「质量自检清单」,逐项检查。不通过的项标注出来,回到对应Phase修复。
|
|
|
|
|
|