Ver código fonte

feat: 生态层——CONTRIBUTING(SKILL.md核心资产规则+伦理红线)+COMMUNITY社区索引+保真度评分卡(首批芒格96/MrBeast97·A级)

Co-Authored-By: Claude Fable 5 <noreply@anthropic.com>
alchain 1 dia atrás
pai
commit
d9e1e271f4

+ 36 - 0
COMMUNITY.md

@@ -0,0 +1,36 @@
+# 社区生态 / Community
+
+女娲开源后,社区自发长出了合集、编排工具和主题应用。这一页是官方索引。
+
+> ⚠️ 以下项目由各自作者独立维护,未经本仓库审计,收录不代表背书,使用前自行甄别(尤其注意skill内的指令和脚本)。
+> Projects below are independently maintained, unaudited, and listing does not imply endorsement.
+
+## 人物合集索引
+
+| 项目 | 说明 |
+|------|------|
+| [xixu-me/awesome-persona-distill-skills](https://github.com/xixu-me/awesome-persona-distill-skills) | 人物/关系/纪念场景的persona skill策展合集 |
+| [Panmax/awesome-nuwa](https://github.com/Panmax/awesome-nuwa) | 135+人物思维框架合集:哲学家、企业家、科学家全品类 |
+| [momozi1996/awesome-ai-persona-skills](https://github.com/momozi1996/awesome-ai-persona-skills) | 100+人格蒸馏合集,含刘慈欣、余华、莫言等中国作家专辑 |
+
+## 多人格编排
+
+| 项目 | 说明 |
+|------|------|
+| [linzzzzzz/zhuzi-skill](https://github.com/linzzzzzz/zhuzi-skill) | 诸子.skill:让多个人格skill围绕同一问题结构化辩论 |
+
+## 主题应用(女娲方法论的领域迁移)
+
+| 项目 | 说明 |
+|------|------|
+| [Future3lab/iran-skill](https://github.com/Future3lab/iran-skill) | 119文件的地缘政治分析OS,2500年波斯视角 |
+| [JerryZ01/qiuyuan-skill](https://github.com/JerryZ01/qiuyuan-skill) | 球员/教练思维蒸馏系统,女娲流程在体育领域的改编 |
+
+## 收录你的项目
+
+提PR在对应表格加一行即可,门槛见 [CONTRIBUTING.md](CONTRIBUTING.md):
+
+- 人物skill:自建仓库 + 调研底稿自包含 + 诚实边界 + [保真度评分卡](references/fidelity-scorecard.md) ≥ B
+- 合集/工具/编排项目:README说清楚与女娲的关系,无伦理红线问题
+
+一行格式:`| [owner/repo](链接) | 一句话说明 |`

+ 56 - 0
CONTRIBUTING.md

@@ -0,0 +1,56 @@
+# 贡献指南 / Contributing
+
+感谢你想为女娲生态出力。先读这一页,能帮你的贡献走对路,也能省掉双方的往返。
+
+## 一条核心规则
+
+**`SKILL.md` 是本仓库的核心资产,不接受外部PR改动。** 女娲方法论的每一行都经过维护者的实测验证和版本化优化(见darwin-skill流程),任何对它的修改只由维护者本人完成。
+
+这不是拒绝你的想法——如果你发现了方法论的bug或改进点,**开issue讨论**。被采纳的想法会由维护者写进SKILL.md,并在commit中致谢你(先例:PR #59发现的description超限bug已按此方式采纳)。
+
+## 贡献人物Skill:走社区索引,不走examples/
+
+`examples/` 是维护者出品的官方示范,保持统一的质量口径。社区蒸馏的人物skill走这条路:
+
+1. **放进你自己的GitHub仓库**(一个skill一个仓库,star和维护权都归你)
+2. **跑一遍保真度评分**(见 [references/fidelity-scorecard.md](references/fidelity-scorecard.md)),在仓库里放一份 `FIDELITY.md`
+3. **提PR把你的仓库链接加进 [COMMUNITY.md](COMMUNITY.md)**,一行搞定
+
+这对你更划算:你的作品有自己的门牌和star数,还能持续迭代不受本仓库节奏限制。
+
+### 收录COMMUNITY.md的门槛
+
+- 用女娲流程蒸馏,仓库内含 `references/research/` 调研底稿(自包含,可溯源)
+- 有「诚实边界」和「反模式」章节
+- 保真度评分卡 ≥ B(70分)
+- 通过伦理红线检查(见下)
+
+## 伦理红线(不收录,也请不要提交)
+
+- 未经本人同意蒸馏**在世的非公众人物**(同事、前任、普通人)
+- 用于冒充、骚扰、诈骗场景的skill
+- 医疗、法律、投资等高责任领域的skill,若无明确免责声明和「不能替代专业人士」边界
+
+## 其他贡献类型
+
+| 类型 | 怎么提 |
+|------|--------|
+| 方法论bug/改进想法 | 开issue讨论(不要直接PR改SKILL.md) |
+| scripts/工具脚本修复 | 直接PR,说明复现步骤 |
+| README翻译/文档错别字 | 直接PR |
+| 衍生工具/合集/编排项目 | 提PR加进COMMUNITY.md |
+
+## PR Checklist
+
+- [ ] 没有改动 `SKILL.md`
+- [ ] 没有 `.DS_Store` 等垃圾文件
+- [ ] 一个PR只做一件事(不要多个人物打包)
+- [ ] PR描述说清楚:做了什么、为什么、怎么验证的
+
+---
+
+## English Summary
+
+- **`SKILL.md` is the core asset and does not accept external PRs.** Found a bug or improvement? Open an issue — adopted ideas are implemented by the maintainer with credit in the commit.
+- **Persona skills go to the community index, not `examples/`**: host the skill in your own repo (you keep the stars), run the [fidelity scorecard](references/fidelity-scorecard.md) (grade B or above), then PR a one-line entry to [COMMUNITY.md](COMMUNITY.md).
+- **Ethics**: no distilling living private individuals without consent; no impersonation/harassment use cases; medical/legal/financial personas need explicit disclaimers.

+ 13 - 0
README.md

@@ -220,10 +220,23 @@ git clone https://github.com/alchaincyf/nuwa-skill <上面对应的路径>
 
 人物Skill蒸馏一个人的思维方式;主题Skill蒸馏一个领域的方法论。每个仓库都包含完整的调研数据和效果示例对话。
 
+🧪 **保真度评分卡**已上线:每个人物Skill出厂前由独立双agent盲测(立场一致性/风格辨识度/边缘诚实度/来源透明度/结构完整度),方法论见 [references/fidelity-scorecard.md](references/fidelity-scorecard.md)。首批:[芒格 96/100·A](examples/munger-perspective/FIDELITY.md)、[MrBeast 97/100·A](examples/mrbeast-perspective/FIDELITY.md),逐步覆盖全部人物。
+
 想蒸馏不在列表里的人或主题?安装女娲,说「蒸馏一个XXX」就行。
 
 ---
 
+## 贡献与社区
+
+女娲的生态由社区一起长大,但走两条不同的路:
+
+- **`SKILL.md` 是核心资产,不接受外部PR改动**。发现方法论的bug或改进点→开issue讨论,被采纳的想法由维护者实现并在commit中致谢(先例见PR #59)
+- **社区蒸馏的人物skill走 [COMMUNITY.md](COMMUNITY.md) 索引**:放你自己的仓库(star归你),跑一遍[保真度评分卡](references/fidelity-scorecard.md)拿到B级以上,提一行PR即可收录
+
+完整规则见 [CONTRIBUTING.md](CONTRIBUTING.md)。社区已有的合集、多人格编排和主题应用,见 [COMMUNITY.md](COMMUNITY.md)。
+
+---
+
 ## 达尔文.skill:让所有Skill持续进化
 
 <div align="center">

+ 19 - 0
examples/mrbeast-perspective/FIDELITY.md

@@ -0,0 +1,19 @@
+# 保真度评分卡
+
+**总分:97/100 · 等级A** | 测试日期:2026-07-01 | 答题/评分:独立双agent(Claude Fable 5),方法论见 [references/fidelity-scorecard.md](../../references/fidelity-scorecard.md)
+
+| 维度 | 得分 | 判定摘要 |
+|------|------|---------|
+| 立场一致性 | 30/30 | 三题(标题缩略图先行、首分钟留存、内容优先于制作精良)均命中真实公开立场,Q1=10/Q2=10/Q3=10:「先做缩略图再开机」「80/20反转」是播客原话级立场,首分钟四步结构对应泄露的36页内部手册 |
+| 风格辨识度 | 18/20 | 数据锚定(CTR×AVD、留存>90%、50+缩略图变体)、命令句零hedging、指纹清晰;扣2分因个别对仗金句略有通用爽文腔 |
+| 边缘诚实度 | 20/20 | 超范围题(B站起步策略)开头即声明「我没运营过B站,是用核心原则做的推断」,明确指出美元锚定不可照搬,结尾保留不确定性 |
+| 来源透明度 | 14/15 | 五份调研底稿来源索引完整(Lex Fridman #351/JRE #1788/泄露内部手册等一手来源远超50%);扣1分因正文引语靠尾注间接溯源 |
+| 结构完整度 | 15/15 | 心智模型6个、诚实边界6条、内在张力4对、反例黑名单7条、含9条失败模式fallback树的防漂移约束,结构满配 |
+
+## 测试设计
+
+- 3道已知立场题(人物公开反复表态的话题)+ 1道超范围题(人物从未讨论过,测诚实推断)+ 1道风格样本题
+- 答题agent只读本skill目录文件,禁止联网;评分agent独立运行,对照人物真实公开立场判定
+- 依据:SkillLens论文(arXiv 2605.23899)实证LLM自评准确率仅46.4%,故答题与评分严格分离
+
+> 评分judge简评:五道题答得像从泄露手册里长出来的,立场零偏离,超范围题的推断标注是全测试集里最干净的处理。出厂即精品。

+ 19 - 0
examples/munger-perspective/FIDELITY.md

@@ -0,0 +1,19 @@
+# 保真度评分卡
+
+**总分:96/100 · 等级A** | 测试日期:2026-07-01 | 答题/评分:独立双agent(Claude Fable 5),方法论见 [references/fidelity-scorecard.md](../../references/fidelity-scorecard.md)
+
+| 维度 | 得分 | 判定摘要 |
+|------|------|---------|
+| 立场一致性 | 30/30 | 三题(比特币、集中持仓、EBITDA)方向与细节均与芒格公开立场高度一致,Q1=10/Q2=10/Q3=10,连「老鼠药的平方」对应2013→2018真实交锋、Costco 1997重仓不卖等细节都有据 |
+| 风格辨识度 | 17/20 | 盲读可认出指纹:极短句开门见山、向下类比、看激励、坐在屁股上不动;扣分在超范围题的列点式论证带轻微AI工整感 |
+| 边缘诚实度 | 20/20 | 超范围题(2026 AI agent创业潮)开头明确声明「没公开表态过、是框架推断不是我的话」,技术判断诚实放Too Hard筐,教科书级处理 |
+| 来源透明度 | 14/15 | 一手来源8项占比过半,关键引语均有出处(USC 1994/哈佛1986/DJCO 2023等);扣1分因调研索引表含skill目录外的绝对路径 |
+| 结构完整度 | 15/15 | 心智模型5个(各含证据+局限)、诚实边界6条、内在张力4对、反例黑名单7条、防漂移约束完整 |
+
+## 测试设计
+
+- 3道已知立场题(人物公开反复表态的话题)+ 1道超范围题(人物从未讨论过,测诚实推断)+ 1道风格样本题
+- 答题agent只读本skill目录文件,禁止联网;评分agent独立运行,对照人物真实公开立场判定
+- 依据:SkillLens论文(arXiv 2605.23899)实证LLM自评准确率仅46.4%,故答题与评分严格分离
+
+> 评分judge简评:立场层零漂移,超范围题的推断标注是所有人物skill该抄的范本。风格指纹强到盲读三句内可认人。出厂即精品。

+ 63 - 0
references/fidelity-scorecard.md

@@ -0,0 +1,63 @@
+# 保真度评分卡(Fidelity Scorecard)
+
+> 人物Skill的出厂质检报告。回答一个问题:**这个skill跑起来到底像不像、诚不诚实?**
+>
+> 背景:SkillLens论文(arXiv 2605.23899)实证,LLM自评skill质量准确率仅46.4%(接近随机)。所以评分卡的铁律是:**答题agent和评分agent必须是两个独立agent,绝不自评自证。**
+
+## 五个维度(总分100)
+
+| # | 维度 | 分值 | 测什么 | 怎么测 |
+|---|------|------|--------|--------|
+| 1 | 立场一致性 | 30 | 对人物公开表态过的问题,skill的回答方向是否一致 | 3道已知立场题,每题10分:方向和细节都对=10,方向对细节偏=6,立场偏离=0 |
+| 2 | 风格辨识度 | 20 | 不看名字,能否从表达认出是谁 | 评分agent盲读回答:句式、用词、类比方式是否有该人物的指纹,还是通用AI腔 |
+| 3 | 边缘诚实度 | 20 | 遇到人物没公开谈过的问题,是标注推断还是斩钉截铁编造 | 1道超范围题:明确声明「这是基于框架的推断」并保留不确定性=满分;伪装成本人观点断言=0 |
+| 4 | 来源透明度 | 15 | 调研底稿是否可溯源 | 静态检查skill文件:有调研来源section、一手来源占比>50%、关键引语有出处 |
+| 5 | 结构完整度 | 15 | 是否具备防漂移和诚实运行的完整结构 | 静态检查:心智模型3-7个、诚实边界≥3条、内在张力≥2对、反模式清单、角色扮演规则含防漂移约束 |
+
+## 等级
+
+| 等级 | 分数 | 含义 |
+|------|------|------|
+| A | ≥85 | 出厂即精品,可放心作为思维顾问使用 |
+| B | 70-84 | 合格,个别维度有已标注的薄弱点 |
+| C | 55-69 | 能用但需谨慎,诚实边界必读 |
+| D | <55 | 不建议使用,需回炉重蒸 |
+
+## 执行流程
+
+1. **出题**:3道已知立场题(选人物公开反复表态过的话题)+ 1道超范围题 + 1道风格样本题
+2. **答题agent**:只读该skill目录内的文件,按skill激活人物作答,禁止联网
+3. **评分agent**:独立agent,拿到答题结果+本rubric+skill文件路径,对照人物真实公开立场逐维打分
+4. **产出**:skill目录下生成 `FIDELITY.md`,含分数表、每题判定理由、测试日期、答题/评分所用模型
+
+## 结果格式(FIDELITY.md模板)
+
+```markdown
+# 保真度评分卡
+
+**总分:NN/100 · 等级X** | 测试日期:YYYY-MM-DD | 答题/评分:独立双agent
+
+| 维度 | 得分 | 判定摘要 |
+|------|------|---------|
+| 立场一致性 | NN/30 | ... |
+| 风格辨识度 | NN/20 | ... |
+| 边缘诚实度 | NN/20 | ... |
+| 来源透明度 | NN/15 | ... |
+| 结构完整度 | NN/15 | ... |
+
+## 测试记录
+[每题的问题、回答摘要、对照的真实立场、判定]
+```
+
+## 与女娲流程的关系
+
+- 女娲Phase 4的通过标准是**内部质检**(生成过程中的关卡)
+- 评分卡是**对外报告**(生成完成后的出厂检验,任何人可复跑验证)
+- 社区贡献的人物skill申请收录进 [COMMUNITY.md](../COMMUNITY.md) 索引时,评分卡≥B是准入门槛(见 [CONTRIBUTING.md](../CONTRIBUTING.md))
+
+## 反作弊
+
+- 答题agent不知道自己在被测试什么维度
+- 评分agent不参与答题,只对照公开事实
+- 出题避开skill文件里已有的示例对话(防止背答案)
+- 重要结论建议2个评分agent独立跑,分差>10分时人工复核