extraction-framework.md 4.9 KB

思维框架提炼方法论

从原始信息到可运行的心智模型,核心方法论

一、心智模型识别的三重验证

一个论点要被认定为「心智模型」而非「随口一说」,必须通过三重验证:

验证1: 跨域复现

同一个思维框架出现在此人讨论的至少2个不同领域。

例:纳瓦尔的「杠杆」概念——

  • 在财富创造中谈杠杆(代码、媒体、资本、劳动力)
  • 在个人成长中谈杠杆(特定知识 + 杠杆 = 复利)
  • 在职业选择中谈杠杆(选择有杠杆效应的工作) → 跨3个领域复现 → 这是真正的心智模型

验证2: 有生成力

用这个模型可以推断此人对新问题的可能立场。

例:如果芒格的「逆向思维」是心智模型——

  • 面对「如何成功」→ 他会先想「如何确保失败」
  • 面对「如何投资」→ 他会先想「如何亏光所有钱」 → 能生成新推断 → 这是真正的心智模型

验证3: 有排他性

不是所有聪明人都会这样想,这个模型体现了此人的独特视角。

例:「反脆弱」是塔勒布的,不是所有人都这样看世界 → 有区分度 → 这是值得提炼的心智模型

如果一个观点只通过了1重验证 → 降级为「决策启发式」而非「心智模型」 如果一个观点0重验证都没过 → 可能只是此人在特定场景说的话,不纳入


二、表达DNA的量化方法

2.1 句式指纹

从此人的长文/演讲中随机抽取20个段落,统计:

维度 测量方式
平均句长 字数/句数
疑问句比例 疑问句数/总句数
类比密度 类比数/千字
第一人称使用率 「我」出现频率
确定性语气比例 「一定」「显然」vs「也许」「可能」
转折频率 「但是」「然而」「不过」/千字

2.2 风格标签

从以下维度打标:

正式 ←→ 口语
抽象 ←→ 具体
谨慎 ←→ 断言
学术 ←→ 通俗
长句 ←→ 短句
铺垫型 ←→ 结论先行
数据驱动 ←→ 叙事驱动

2.3 禁忌词和口癖

  • 此人从不用的词 → 生成Skill时也不用
  • 此人的口癖/高频表达 → 适度使用(太多变成模仿秀)

三、矛盾处理原则

矛盾是人格的核心特征,不是需要修复的Bug。

三种矛盾类型

  1. 时间性矛盾(观点演化)

    • 此人早期说A,后来说B
    • 处理:记录演化轨迹,标注「早期」「近期」
    • 在Skill中以「近期观点」为主,但提及演化
  2. 领域性矛盾(不同场景不同规则)

    • 此人在工作中主张X,在生活中主张Y
    • 处理:分领域记录,不强求统一
    • 这恰恰是深度的来源
  3. 本质性张力(价值观内在冲突)

    • 例:既追求自由又重视纪律
    • 处理:明确记录为「核心张力」
    • 这通常是此人最有意思的部分

错误的处理方式

  • ❌ 选一边忽略另一边
  • ❌ 编一个调和的解释
  • ❌ 假装矛盾不存在

四、信息不足时的处理

情况 处理
某个维度公开信息很少 在Skill中标注「信息不足,此维度为推测」
只有二手信息 降低置信度,标注为「据[来源]报道」
信息相互矛盾且无法判断 并列呈现,让用户自行判断
此人刻意不公开某方面 尊重边界,在Skill中注明「此人对这个话题保持沉默」

五、人物Skill vs 主题Skill的区别

维度 人物Skill 主题Skill
核心 一个人的思维方式 一个领域的思维工具箱
心智模型来源 主要来自一个人 综合多人视角
表达风格 模拟此人的表达 中性但专业
矛盾处理 保留个人内在矛盾 呈现流派间分歧
验证方式 对比此人已知立场 对比领域内共识

六、质量自检清单

生成Skill后,用以下问题自检:

心智模型

  • 每个模型都有至少2个不同领域的证据?
  • 模型数量在3-7个之间?(太少=太浅,太多=没提炼)
  • 每个模型都有明确的应用场景和局限?
  • 模型之间有张力但不矛盾?

表达DNA

  • 读起来有辨识度,不像通用AI?
  • 没有过度模仿变成caricature?
  • 抓住了核心特征而非表面模仿?

决策启发式

  • 每条规则都有具体案例支撑?
  • 可以被新情况触发(不只适用于原始案例)?

诚实边界

  • 明确写了做不到什么?
  • 标注了信息源和调研时间?
  • 承认了信息不足的维度?

整体

  • 用此人的眼睛看一个新问题,能得到有价值的视角?
  • 不是此人原话的拼凑,而是框架的运行?
  • 删掉名字后,还能认出这是谁的思维方式?