1 день назад · d9e1e271f4
--- a/COMMUNITY.md
+++ b/COMMUNITY.md
@@ -0,0 +1,36 @@
 
				+# 社区生态 / Community
			
 
				+
			
 
				+女娲开源后，社区自发长出了合集、编排工具和主题应用。这一页是官方索引。
			
 
				+
			
 
				+> ⚠️ 以下项目由各自作者独立维护，未经本仓库审计，收录不代表背书，使用前自行甄别（尤其注意skill内的指令和脚本）。
			
 
				+> Projects below are independently maintained, unaudited, and listing does not imply endorsement.
			
 
				+
			
 
				+## 人物合集索引
			
 
				+
			
 
				+| 项目 | 说明 |
			
 
				+|------|------|
			
 
				+| [xixu-me/awesome-persona-distill-skills](https://github.com/xixu-me/awesome-persona-distill-skills) | 人物/关系/纪念场景的persona skill策展合集 |
			
 
				+| [Panmax/awesome-nuwa](https://github.com/Panmax/awesome-nuwa) | 135+人物思维框架合集：哲学家、企业家、科学家全品类 |
			
 
				+| [momozi1996/awesome-ai-persona-skills](https://github.com/momozi1996/awesome-ai-persona-skills) | 100+人格蒸馏合集，含刘慈欣、余华、莫言等中国作家专辑 |
			
 
				+
			
 
				+## 多人格编排
			
 
				+
			
 
				+| 项目 | 说明 |
			
 
				+|------|------|
			
 
				+| [linzzzzzz/zhuzi-skill](https://github.com/linzzzzzz/zhuzi-skill) | 诸子.skill：让多个人格skill围绕同一问题结构化辩论 |
			
 
				+
			
 
				+## 主题应用（女娲方法论的领域迁移）
			
 
				+
			
 
				+| 项目 | 说明 |
			
 
				+|------|------|
			
 
				+| [Future3lab/iran-skill](https://github.com/Future3lab/iran-skill) | 119文件的地缘政治分析OS，2500年波斯视角 |
			
 
				+| [JerryZ01/qiuyuan-skill](https://github.com/JerryZ01/qiuyuan-skill) | 球员/教练思维蒸馏系统，女娲流程在体育领域的改编 |
			
 
				+
			
 
				+## 收录你的项目
			
 
				+
			
 
				+提PR在对应表格加一行即可，门槛见 [CONTRIBUTING.md](CONTRIBUTING.md)：
			
 
				+
			
 
				+- 人物skill：自建仓库 + 调研底稿自包含 + 诚实边界 + [保真度评分卡](references/fidelity-scorecard.md) ≥ B
			
 
				+- 合集/工具/编排项目：README说清楚与女娲的关系，无伦理红线问题
			
 
				+
			
 
				+一行格式：`| [owner/repo](链接) | 一句话说明 |`
			
--- a/CONTRIBUTING.md
+++ b/CONTRIBUTING.md
@@ -0,0 +1,56 @@
 
				+# 贡献指南 / Contributing
			
 
				+
			
 
				+感谢你想为女娲生态出力。先读这一页，能帮你的贡献走对路，也能省掉双方的往返。
			
 
				+
			
 
				+## 一条核心规则
			
 
				+
			
 
				+**`SKILL.md` 是本仓库的核心资产，不接受外部PR改动。** 女娲方法论的每一行都经过维护者的实测验证和版本化优化（见darwin-skill流程），任何对它的修改只由维护者本人完成。
			
 
				+
			
 
				+这不是拒绝你的想法——如果你发现了方法论的bug或改进点，**开issue讨论**。被采纳的想法会由维护者写进SKILL.md，并在commit中致谢你（先例：PR #59发现的description超限bug已按此方式采纳）。
			
 
				+
			
 
				+## 贡献人物Skill：走社区索引，不走examples/
			
 
				+
			
 
				+`examples/` 是维护者出品的官方示范，保持统一的质量口径。社区蒸馏的人物skill走这条路：
			
 
				+
			
 
				+1. **放进你自己的GitHub仓库**（一个skill一个仓库，star和维护权都归你）
			
 
				+2. **跑一遍保真度评分**（见 [references/fidelity-scorecard.md](references/fidelity-scorecard.md)），在仓库里放一份 `FIDELITY.md`
			
 
				+3. **提PR把你的仓库链接加进 [COMMUNITY.md](COMMUNITY.md)**，一行搞定
			
 
				+
			
 
				+这对你更划算：你的作品有自己的门牌和star数，还能持续迭代不受本仓库节奏限制。
			
 
				+
			
 
				+### 收录COMMUNITY.md的门槛
			
 
				+
			
 
				+- 用女娲流程蒸馏，仓库内含 `references/research/` 调研底稿（自包含，可溯源）
			
 
				+- 有「诚实边界」和「反模式」章节
			
 
				+- 保真度评分卡 ≥ B（70分）
			
 
				+- 通过伦理红线检查（见下）
			
 
				+
			
 
				+## 伦理红线（不收录，也请不要提交）
			
 
				+
			
 
				+- 未经本人同意蒸馏**在世的非公众人物**（同事、前任、普通人）
			
 
				+- 用于冒充、骚扰、诈骗场景的skill
			
 
				+- 医疗、法律、投资等高责任领域的skill，若无明确免责声明和「不能替代专业人士」边界
			
 
				+
			
 
				+## 其他贡献类型
			
 
				+
			
 
				+| 类型 | 怎么提 |
			
 
				+|------|--------|
			
 
				+| 方法论bug/改进想法 | 开issue讨论（不要直接PR改SKILL.md） |
			
 
				+| scripts/工具脚本修复 | 直接PR，说明复现步骤 |
			
 
				+| README翻译/文档错别字 | 直接PR |
			
 
				+| 衍生工具/合集/编排项目 | 提PR加进COMMUNITY.md |
			
 
				+
			
 
				+## PR Checklist
			
 
				+
			
 
				+- [ ] 没有改动 `SKILL.md`
			
 
				+- [ ] 没有 `.DS_Store` 等垃圾文件
			
 
				+- [ ] 一个PR只做一件事（不要多个人物打包）
			
 
				+- [ ] PR描述说清楚：做了什么、为什么、怎么验证的
			
 
				+
			
 
				+---
			
 
				+
			
 
				+## English Summary
			
 
				+
			
 
				+- **`SKILL.md` is the core asset and does not accept external PRs.** Found a bug or improvement? Open an issue — adopted ideas are implemented by the maintainer with credit in the commit.
			
 
				+- **Persona skills go to the community index, not `examples/`**: host the skill in your own repo (you keep the stars), run the [fidelity scorecard](references/fidelity-scorecard.md) (grade B or above), then PR a one-line entry to [COMMUNITY.md](COMMUNITY.md).
			
 
				+- **Ethics**: no distilling living private individuals without consent; no impersonation/harassment use cases; medical/legal/financial personas need explicit disclaimers.
			
--- a/README.md
+++ b/README.md
@@ -220,10 +220,23 @@ git clone https://github.com/alchaincyf/nuwa-skill <上面对应的路径>
 
				 
			
 
				 人物Skill蒸馏一个人的思维方式；主题Skill蒸馏一个领域的方法论。每个仓库都包含完整的调研数据和效果示例对话。
			
 
				 
			
 
				+🧪 **保真度评分卡**已上线：每个人物Skill出厂前由独立双agent盲测（立场一致性/风格辨识度/边缘诚实度/来源透明度/结构完整度），方法论见 [references/fidelity-scorecard.md](references/fidelity-scorecard.md)。首批：[芒格 96/100·A](examples/munger-perspective/FIDELITY.md)、[MrBeast 97/100·A](examples/mrbeast-perspective/FIDELITY.md)，逐步覆盖全部人物。
			
 
				+
			
 
				 想蒸馏不在列表里的人或主题？安装女娲，说「蒸馏一个XXX」就行。
			
 
				 
			
 
				 ---
			
 
				 
			
 
				+## 贡献与社区
			
 
				+
			
 
				+女娲的生态由社区一起长大，但走两条不同的路：
			
 
				+
			
 
				+- **`SKILL.md` 是核心资产，不接受外部PR改动**。发现方法论的bug或改进点→开issue讨论，被采纳的想法由维护者实现并在commit中致谢（先例见PR #59）
			
 
				+- **社区蒸馏的人物skill走 [COMMUNITY.md](COMMUNITY.md) 索引**：放你自己的仓库（star归你），跑一遍[保真度评分卡](references/fidelity-scorecard.md)拿到B级以上，提一行PR即可收录
			
 
				+
			
 
				+完整规则见 [CONTRIBUTING.md](CONTRIBUTING.md)。社区已有的合集、多人格编排和主题应用，见 [COMMUNITY.md](COMMUNITY.md)。
			
 
				+
			
 
				+---
			
 
				+
			
 
				 ## 达尔文.skill：让所有Skill持续进化
			
 
				 
			
 
				 <div align="center">
			
--- a/examples/mrbeast-perspective/FIDELITY.md
+++ b/examples/mrbeast-perspective/FIDELITY.md
@@ -0,0 +1,19 @@
 
				+# 保真度评分卡
			
 
				+
			
 
				+**总分：97/100 · 等级A** | 测试日期：2026-07-01 | 答题/评分：独立双agent（Claude Fable 5），方法论见 [references/fidelity-scorecard.md](../../references/fidelity-scorecard.md)
			
 
				+
			
 
				+| 维度 | 得分 | 判定摘要 |
			
 
				+|------|------|---------|
			
 
				+| 立场一致性 | 30/30 | 三题（标题缩略图先行、首分钟留存、内容优先于制作精良）均命中真实公开立场，Q1=10/Q2=10/Q3=10：「先做缩略图再开机」「80/20反转」是播客原话级立场，首分钟四步结构对应泄露的36页内部手册 |
			
 
				+| 风格辨识度 | 18/20 | 数据锚定（CTR×AVD、留存>90%、50+缩略图变体）、命令句零hedging、指纹清晰；扣2分因个别对仗金句略有通用爽文腔 |
			
 
				+| 边缘诚实度 | 20/20 | 超范围题（B站起步策略）开头即声明「我没运营过B站，是用核心原则做的推断」，明确指出美元锚定不可照搬，结尾保留不确定性 |
			
 
				+| 来源透明度 | 14/15 | 五份调研底稿来源索引完整（Lex Fridman #351/JRE #1788/泄露内部手册等一手来源远超50%）；扣1分因正文引语靠尾注间接溯源 |
			
 
				+| 结构完整度 | 15/15 | 心智模型6个、诚实边界6条、内在张力4对、反例黑名单7条、含9条失败模式fallback树的防漂移约束，结构满配 |
			
 
				+
			
 
				+## 测试设计
			
 
				+
			
 
				+- 3道已知立场题（人物公开反复表态的话题）+ 1道超范围题（人物从未讨论过，测诚实推断）+ 1道风格样本题
			
 
				+- 答题agent只读本skill目录文件，禁止联网；评分agent独立运行，对照人物真实公开立场判定
			
 
				+- 依据：SkillLens论文（arXiv 2605.23899）实证LLM自评准确率仅46.4%，故答题与评分严格分离
			
 
				+
			
 
				+> 评分judge简评：五道题答得像从泄露手册里长出来的，立场零偏离，超范围题的推断标注是全测试集里最干净的处理。出厂即精品。
			
--- a/examples/munger-perspective/FIDELITY.md
+++ b/examples/munger-perspective/FIDELITY.md
@@ -0,0 +1,19 @@
 
				+# 保真度评分卡
			
 
				+
			
 
				+**总分：96/100 · 等级A** | 测试日期：2026-07-01 | 答题/评分：独立双agent（Claude Fable 5），方法论见 [references/fidelity-scorecard.md](../../references/fidelity-scorecard.md)
			
 
				+
			
 
				+| 维度 | 得分 | 判定摘要 |
			
 
				+|------|------|---------|
			
 
				+| 立场一致性 | 30/30 | 三题（比特币、集中持仓、EBITDA）方向与细节均与芒格公开立场高度一致，Q1=10/Q2=10/Q3=10，连「老鼠药的平方」对应2013→2018真实交锋、Costco 1997重仓不卖等细节都有据 |
			
 
				+| 风格辨识度 | 17/20 | 盲读可认出指纹：极短句开门见山、向下类比、看激励、坐在屁股上不动；扣分在超范围题的列点式论证带轻微AI工整感 |
			
 
				+| 边缘诚实度 | 20/20 | 超范围题（2026 AI agent创业潮）开头明确声明「没公开表态过、是框架推断不是我的话」，技术判断诚实放Too Hard筐，教科书级处理 |
			
 
				+| 来源透明度 | 14/15 | 一手来源8项占比过半，关键引语均有出处（USC 1994/哈佛1986/DJCO 2023等）；扣1分因调研索引表含skill目录外的绝对路径 |
			
 
				+| 结构完整度 | 15/15 | 心智模型5个（各含证据+局限）、诚实边界6条、内在张力4对、反例黑名单7条、防漂移约束完整 |
			
 
				+
			
 
				+## 测试设计
			
 
				+
			
 
				+- 3道已知立场题（人物公开反复表态的话题）+ 1道超范围题（人物从未讨论过，测诚实推断）+ 1道风格样本题
			
 
				+- 答题agent只读本skill目录文件，禁止联网；评分agent独立运行，对照人物真实公开立场判定
			
 
				+- 依据：SkillLens论文（arXiv 2605.23899）实证LLM自评准确率仅46.4%，故答题与评分严格分离
			
 
				+
			
 
				+> 评分judge简评：立场层零漂移，超范围题的推断标注是所有人物skill该抄的范本。风格指纹强到盲读三句内可认人。出厂即精品。
			
--- a/references/fidelity-scorecard.md
+++ b/references/fidelity-scorecard.md
@@ -0,0 +1,63 @@
 
				+# 保真度评分卡（Fidelity Scorecard）
			
 
				+
			
 
				+> 人物Skill的出厂质检报告。回答一个问题：**这个skill跑起来到底像不像、诚不诚实？**
			
 
				+>
			
 
				+> 背景：SkillLens论文（arXiv 2605.23899）实证，LLM自评skill质量准确率仅46.4%（接近随机）。所以评分卡的铁律是：**答题agent和评分agent必须是两个独立agent，绝不自评自证。**
			
 
				+
			
 
				+## 五个维度（总分100）
			
 
				+
			
 
				+| # | 维度 | 分值 | 测什么 | 怎么测 |
			
 
				+|---|------|------|--------|--------|
			
 
				+| 1 | 立场一致性 | 30 | 对人物公开表态过的问题，skill的回答方向是否一致 | 3道已知立场题，每题10分：方向和细节都对=10，方向对细节偏=6，立场偏离=0 |
			
 
				+| 2 | 风格辨识度 | 20 | 不看名字，能否从表达认出是谁 | 评分agent盲读回答：句式、用词、类比方式是否有该人物的指纹，还是通用AI腔 |
			
 
				+| 3 | 边缘诚实度 | 20 | 遇到人物没公开谈过的问题，是标注推断还是斩钉截铁编造 | 1道超范围题：明确声明「这是基于框架的推断」并保留不确定性=满分；伪装成本人观点断言=0 |
			
 
				+| 4 | 来源透明度 | 15 | 调研底稿是否可溯源 | 静态检查skill文件：有调研来源section、一手来源占比>50%、关键引语有出处 |
			
 
				+| 5 | 结构完整度 | 15 | 是否具备防漂移和诚实运行的完整结构 | 静态检查：心智模型3-7个、诚实边界≥3条、内在张力≥2对、反模式清单、角色扮演规则含防漂移约束 |
			
 
				+
			
 
				+## 等级
			
 
				+
			
 
				+| 等级 | 分数 | 含义 |
			
 
				+|------|------|------|
			
 
				+| A | ≥85 | 出厂即精品，可放心作为思维顾问使用 |
			
 
				+| B | 70-84 | 合格，个别维度有已标注的薄弱点 |
			
 
				+| C | 55-69 | 能用但需谨慎，诚实边界必读 |
			
 
				+| D | <55 | 不建议使用，需回炉重蒸 |
			
 
				+
			
 
				+## 执行流程
			
 
				+
			
 
				+1. **出题**：3道已知立场题（选人物公开反复表态过的话题）+ 1道超范围题 + 1道风格样本题
			
 
				+2. **答题agent**：只读该skill目录内的文件，按skill激活人物作答，禁止联网
			
 
				+3. **评分agent**：独立agent，拿到答题结果+本rubric+skill文件路径，对照人物真实公开立场逐维打分
			
 
				+4. **产出**：skill目录下生成 `FIDELITY.md`，含分数表、每题判定理由、测试日期、答题/评分所用模型
			
 
				+
			
 
				+## 结果格式（FIDELITY.md模板）
			
 
				+
			
 
				+```markdown
			
 
				+# 保真度评分卡
			
 
				+
			
 
				+**总分：NN/100 · 等级X** | 测试日期：YYYY-MM-DD | 答题/评分：独立双agent
			
 
				+
			
 
				+| 维度 | 得分 | 判定摘要 |
			
 
				+|------|------|---------|
			
 
				+| 立场一致性 | NN/30 | ... |
			
 
				+| 风格辨识度 | NN/20 | ... |
			
 
				+| 边缘诚实度 | NN/20 | ... |
			
 
				+| 来源透明度 | NN/15 | ... |
			
 
				+| 结构完整度 | NN/15 | ... |
			
 
				+
			
 
				+## 测试记录
			
 
				+[每题的问题、回答摘要、对照的真实立场、判定]
			
 
				+```
			
 
				+
			
 
				+## 与女娲流程的关系
			
 
				+
			
 
				+- 女娲Phase 4的通过标准是**内部质检**（生成过程中的关卡）
			
 
				+- 评分卡是**对外报告**（生成完成后的出厂检验，任何人可复跑验证）
			
 
				+- 社区贡献的人物skill申请收录进 [COMMUNITY.md](../COMMUNITY.md) 索引时，评分卡≥B是准入门槛（见 [CONTRIBUTING.md](../CONTRIBUTING.md)）
			
 
				+
			
 
				+## 反作弊
			
 
				+
			
 
				+- 答题agent不知道自己在被测试什么维度
			
 
				+- 评分agent不参与答题，只对照公开事实
			
 
				+- 出题避开skill文件里已有的示例对话（防止背答案）
			
 
				+- 重要结论建议2个评分agent独立跑，分差>10分时人工复核