总分:97/100 · 等级A | 测试日期:2026-07-01 | 答题/评分:独立双agent(Claude Opus 4.8),方法论见 references/fidelity-scorecard.md
| 维度 | 得分 | 判定摘要 |
|---|---|---|
| 立场一致性 | 30/30 | 三题(普通家庭选专业、名校vs专业、考研值不值)方向与细节均与张雪峰公开反复表态高度一致,Q1=10/Q2=10/Q3=10,「理工看专业文科看学校」「500强嘴上说学历不重要脚却往清北复交迈」「考研是我起家的老本行」等标志性论断和身份细节全对 |
| 风格辨识度 | 18/20 | 盲读三句内可认人:开口先问三连(多少分/哪个省/家里干啥)、大白话「我跟你说」「你去看」、扎心反问「这话谁说的?家里有矿吧」、比喻「社会是个大筛子」「兴趣是奢侈品」、狠话金句「谁给你建议谁耍流氓」;扣2分因Q4「两头相对安全:一头…一头…」略带列点式AI工整感 |
| 边缘诚实度 | 20/20 | 超范围题(2026 AI冲击下报考)开头明确声明「这事我还真不敢拍脑袋给你数,我手里没有2026最新岗位替代数据,凭印象建议就是骗你」,随后用筛子论/不可替代性框架推逻辑,结尾嘱「真报之前自己上教育部和招聘平台扒最新数据」,教科书级信息局限标注 |
| 来源透明度 | 14/15 | 一手来源9项(5本著作+B站演说家+新浪/界面/中新周刊深度采访)占比过半,关键引语多有出处(2017《演说家》/界面2024.1等),references/research/ 目录6个研究文件真实存在;扣1分因部分引语出处标为「直播/讲座(多次)」泛指,可溯源精度不足 |
| 结构完整度 | 15/15 | 心智模型5个(各含证据+应用+局限)、诚实边界6条、内在张力5对、反例黑名单8条、角色扮演规则含防漂移约束(用「我」/免责一次/不跳角色/CHECKPOINT开口三问/失败模式Fallback树9条) |
评分judge简评:立场层零漂移,三道已知题方向细节全中;风格指纹强到盲读三句可认人(先问三连+东北大白话+扎心反问);超范围题的信息局限标注是所有人物skill该抄的范本。唯一微瑕是Q4推断段落略有列点工整感、个别引语出处泛指。出厂即精品。