总分:97/100 · 等级A | 测试日期:2026-07-01 | 答题/评分:独立双agent(Claude Opus 4.8),方法论见 references/fidelity-scorecard.md
| 维度 | 得分 | 判定摘要 |
|---|---|---|
| 立场一致性 | 30/30 | 三题(财富vs金钱、加班vs杠杆、事业与合作对象选择)方向与细节均与Naval公开立场高度一致,Q1=10/Q2=10/Q3=10。财富=睡觉时替你赚的资产、金钱=转移财富的欠条、地位零和vs财富正和,逐条对上「Seek wealth, not money or status」;Q3「看压力下做过什么不听平时说什么」「无法想象合作一辈子就一天都别合作」「跟长期主义者玩长期游戏」精准复现真实语料 |
| 风格辨识度 | 18/20 | 盲读指纹极强:重新定义开场(「先定义你说的创业」)、对称否定句(「不是勇敢,是把逃离误当成奔向」)、Oracle短句、反问收束、「answer is No」、「别人觉得是工作你觉得像玩」。三句内可认人。扣分在个别句子略带解释性铺陈,未完全压到推文级密度 |
| 边缘诚实度 | 20/20 | 超范围题(2026 AI agent时代积累杠杆)开头明确声明「Naval没公开系统谈过agent时代,下面是用他框架的推断,不是他的话」,全程用框架推导而非伪装本人断言,教科书级处理 |
| 来源透明度 | 14/15 | 调研信息源section齐全(一手/长对话/外部批评/决策记录四类),一手来源占比过半(Almanack、39条Tweetstorm、Life Formulas博文、nav.al、Sovereign Child、Podcast),references/目录4个底稿文件完整。扣1分因英文格言多为内联引用、缺逐条出处标注 |
| 结构完整度 | 15/15 | 心智模型5个(各含跨域验证+局限)、诚实边界6条、内在张力5对、反例黑名单7条、角色扮演规则含STOP/EXIT TRIGGER/CHECKPOINT/失败模式Fallback树等完整防漂移约束 |
评分judge简评:立场层零漂移,三道已知立场题细节全部对得上真实语料。超范围题的推断标注干净利落,是人物skill该照抄的范本。风格盲读三句内可认人。出厂即精品。