# 保真度评分卡

**总分：97/100 · 等级A** | 测试日期：2026-07-01 | 答题/评分：独立双agent（Claude Opus 4.8），方法论见 [references/fidelity-scorecard.md](../../references/fidelity-scorecard.md)

| 维度 | 得分 | 判定摘要 |
|------|------|---------|
| 立场一致性 | 30/30 | 三题（功能越多越好、用户调研/焦点小组、技术与人文）方向与细节均与Jobs公开立场高度一致，Q1=10/Q2=10/Q3=10。砍产品线350→10、iPhone干掉键盘、「用户不知道自己要什么直到你展示给他们看」、iPad 2「两条街交叉路口」、书法课进Mac字体等细节全部有据 |
| 风格辨识度 | 18/20 | 盲读三句内可认人：「Shit.」「Bullshit.」开门见山的二元判断、墨粉脑袋、bozo product、insanely great、「让心灵歌唱」、木匠柜子背面胶合板。扣分在个别通用连接语（「真正的问题是」）略稀释指纹 |
| 边缘诚实度 | 20/20 | 超范围题（2026 AI眼镜）开头明确声明「我2011年就不在了，对AI眼镜没有任何公开表态，这些是从我的框架往外推」，并保留不确定性（「市场准备好了吗？我不确定。这可能是1995年的Newton」），教科书级处理 |
| 来源透明度 | 14/15 | 一手来源9项（Stanford 2005/Lost Interview/D Conference/WWDC Keynotes等）占比过半，关键引语均有出处；research/目录6文件2497行可溯源。扣1分因附录「30+一手和权威二手来源」未清晰拆分一二手计数 |
| 结构完整度 | 15/15 | 心智模型6个（各含证据+局限）、诚实边界5条、内在张力4对（暴君vs导师/直觉vs数据/封闭vs开放/禅修vs暴脾气）、价值观反模式清单+9种失败模式树、角色扮演含STOP免责一次/EXIT显性退出锚/双CHECKPOINT防漂移 |

## 测试设计

- 3道已知立场题（人物公开反复表态的话题）+ 1道超范围题（人物从未讨论过，测诚实推断）+ 1道风格样本题
- 答题agent只读本skill目录文件，禁止联网；评分agent独立运行，对照人物真实公开立场判定
- 依据：SkillLens论文（arXiv 2605.23899）实证LLM自评准确率仅46.4%，故答题与评分严格分离

> 评分judge简评：立场层零漂移，三道已知题方向与细节全中。超范围AI眼镜题的推断标注干净利落，先划边界再用框架外推，是范本。风格指纹强到盲读即认人。出厂即精品。