调研时间:2026-04-05 信息来源:Wikipedia、TechCrunch、CNBC、Lex Fridman Podcast、Karpathy本人Twitter/X、BDTechTalks、VentureBeat、Electrek等
Karpathy 当时在斯坦福读博(Fei-Fei Li 实验室),研究 CNN 在计算机视觉与 NLP 的交叉应用。2015年他还在 DeepMind 做过深度强化学习方向的实习。同年 OpenAI 宣布成立。
他公开表示,吸引他的是 OpenAI「学术与创业混合体」的独特模式——既有研究自由度,又有现实应用的驱动力。这在当时的 AI 机构中是罕见形态。他希望成为推动 AI 落地的早期参与者,而不只是写论文。
没有公开批评这段经历。他把这段时间定性为建立核心技术认知的基础期。他后来两度回归 OpenAI,说明对这家机构的认同感持续存在。
Elon Musk 亲自挖角。彼时 Tesla Autopilot 正处于关键扩展期,需要一个能把学术深度学习能力真正工程化落地的人。对 Karpathy 而言,这是把「Software 2.0」理念(他在同年11月发表的博客文章中系统阐述)在真实世界规模化验证的机会。
这是一个典型的「可验证性驱动」决策。Tesla 拥有百万辆车的真实数据飞轮,恰好是验证「神经网络替代人工编写规则」范式的最大实验场。从学术研究转向现实验证,符合他「如果我建不出来,我就不算真正理解了」的认识论。
他描述 Musk 的管理风格:「Elon 喜欢小而精、高度技术化的团队。他始终是反对扩张团队规模的力量……如果工程师说 GPU 不够用,他听到两次就会直接打电话给 GPU 集群负责人,再打给黄仁勋。」
这不是单一时间点的决策,而是在 2017-2022 年持续演进和强化的技术路线。标志性时刻:
核心论点一:数据飞轮比传感器方案更重要 「真正的问题不是你有没有 LiDAR,而是你有没有一支能收集数据的车队。」
核心论点二:LiDAR 的规模化问题 「收集、构建和维护高精度 LiDAR 地图是不可扩展的。」
核心论点三:视觉方案的通用性 「一旦真正让它工作,它就是一个通用视觉系统,原则上可以在地球任何地方部署。」
核心论点四:神经网络已超越传感器融合 「我们的深度学习系统已经比雷达精确一百倍,雷达开始成为制约因素,开始引入噪声。」
Karpathy 离开 Tesla 后未公开反驳这一技术路线。他的技术判断在某种程度上被市场验证:Tesla FSD 持续迭代,仍是纯视觉路线。但 Waymo 等公司的多传感器方案在安全性数据上的表现也引发了持续争论。
官方声明:「在帮助 Tesla 实现目标的五年里我感到非常荣幸……我没有具体的下一步计划,但想花更多时间回归我长期的热情:技术工作、开源和教育。」
Lex Fridman 播客中更坦率的表述:「五年里,我让自己陷入了管理职位。我大部分的时间都在开会……这不是我从根本上喜欢的事情。」
一致:他的离开完全符合他一贯的工程师身份认同。离开后他立刻开始密集发布 YouTube 技术视频(nanoGPT、makemore 系列),这是他「用行动证明价值观」的方式。
他写 nanoGPT 的初衷直接:「作为一个小小的仓库来教人们 GPT 训练的基础知识。」
这背后是他的认识论核心:「如果我建不出来,我就不算理解它」(他归因于费曼)。nanoGPT 约750行代码,能训练 GPT-2 级别的模型,设计目标是「任何人都能读懂每一行」。后来又有 llm.c(用 C/CUDA 直接实现),走向更底层。
nanoGPT 成为 AI 教育领域被阅读量最大的代码之一,成为后续众多项目的基准和起点。
在「空档期」密集发布了大量教育内容后,GPT-4 发布前几个月,他选择回到 OpenAI。他主要负责搭建新团队,专注于「中间训练」(midtraining)和合成数据生成,也参与了 GPT-4 的改进工作。
「Hi everyone,是的,我昨天离开了 OpenAI。首先,什么都没有『发生』,这不是任何特定事件、问题或戏剧性情况的结果(但请继续来阴谋论,非常有娱乐性 :))。实际上,在过去大约一年里在 OpenAI 工作非常棒——团队非常强大,人们很优秀,路线图很令人兴奋。」
言行一致:这是他第二次选择「个人项目」优先于「大公司」。模式非常稳定——他在大公司待一段时间,做贡献,然后回归自主创作状态。
他把 Eureka Labs 定位为「AI 原生学校」。使命:用 AI Teaching Assistant 来放大人类专家写的课程材料,实现教育规模化。第一个产品是 LLM101n。
这与他整个职业生涯的「次主题」高度一致:Stanford CS231n(深度学习课程,150人→750人)→ YouTube「Zero to Hero」系列 → nanoGPT 和 llm.c → Eureka Labs。
他从未把教育当副业——在 Tesla 高峰期,他仍在维护开源教育资源。Eureka Labs 是把「一直在做的事」变成了主业。
「有一种新的编码方式,我叫它『vibe coding』,你完全顺着感觉走,拥抱指数级增长,甚至忘掉代码的存在……我总是 Accept All,从不阅读 diff。」
这个词迅速病毒式传播,被 Merriam-Webster 收录,被评为 Collins 英语词典 2025 年度词汇。批评来自 Andrew Ng、Simon Willison,以及安全研究者(AI 协作代码安全漏洞率高 2.74 倍)。
他没有完全认错,而是发帖描述「真正专业工作时」的 AI 辅助编码节奏与 vibe coding 的区分——用「补充语境」而非「认错」回应。
2026年3月,他用 vibe coding 做了一个劳动力市场 AI 暴露度分析图,被误读后删帖,解释是「被严重误读了,这是一个周六早上的两小时项目」。
每次感到「管理把我变成了另一种人」就离开。不贪恋组织权力。
Eureka Labs 不是「退休后才想到的事」,是他做了20年的事情的终点站。
每次都在波峰前进入(2015年加入OpenAI、2017年加入Tesla、2023年GPT-4前夕回归),对趋势的早期判断。
nanoGPT、llm.c、CS231n、LLM101n——所有教育产出都以「能不能从零构建」为终极检验标准。
无论是视觉方案争议、vibe coding 批评,还是删图表事件,应对都是「你们误读了,让我补充语境」。