Ilya Sutskever 学术论文、著作与核心思想调研

调研日期：2026-04-05 调研人：Claude Opus 4.6 信息源黑名单：知乎、微信公众号、百度百科均未使用

一、人物背景速览

Ilya Sutskever（1985年生于俄罗斯，5岁移居以色列，后移居加拿大）

时间	事件
2005	多伦多大学数学学士（从11年级直接入学）
2007	多伦多大学CS硕士，师从Geoffrey Hinton，论文：Nonlinear Multilayered Sequence Models
2012	与Krizhevsky、Hinton共同创建AlexNet，开启深度学习革命
2012	Stanford博士后（约两个月，Andrew Ng实验室）
2013	Google收购DNNResearch → 加入Google Brain
2013	多伦多大学CS博士，论文：Training Recurrent Neural Networks
2014	在Google Brain创建Seq2Seq算法
2015.12	离开Google，联合创立OpenAI，任首席科学家
2023.07	在OpenAI成立Superalignment团队
2023.11	参与董事会罢免Sam Altman，后公开表示后悔
2024.05	离开OpenAI
2024.06	创立SSI（Safe Superintelligence Inc.）
2025.03	SSI估值320亿美元，融资20亿
2025.07	出任SSI CEO

来源：Wikipedia、多伦多大学 | 可信度：一手+权威二手

二、重要学术论文

2.1 里程碑论文（按时间排列）

1. ImageNet Classification with Deep Convolutional Neural Networks（AlexNet，2012）

作者：Alex Krizhevsky, Ilya Sutskever, Geoffrey E. Hinton
核心贡献：用深度CNN在ImageNet上大幅超越传统方法，引爆深度学习革命
引用量：极高（Google Scholar显示Sutskever总引用78万+，此论文是最高引之一）
论文链接：NeurIPS 2012
可信度：一手

2. Sequence to Sequence Learning with Neural Networks（Seq2Seq，2014）

作者：Ilya Sutskever, Oriol Vinyals, Quoc V. Le
核心贡献：用多层LSTM将输入序列映射为固定维度向量，再解码为目标序列；奠定机器翻译和对话系统基础
论文链接：arXiv:1409.3215
可信度：一手

3. Recurrent Neural Network Regularization（2014）

作者：Wojciech Zaremba, Ilya Sutskever, Oriol Vinyals
核心贡献：提出RNN正则化方法，改善训练稳定性
论文链接：arXiv:1409.2329
可信度：一手

4. Language Models are Unsupervised Multitask Learners（GPT-2，2019）

作者：Alec Radford, Jeffrey Wu, Rewon Child, David Luan, Dario Amodei, Ilya Sutskever
核心贡献：展示语言模型在零样本设置下学习多任务能力，1.5B参数的GPT-2在7/8语言建模基准上达到SOTA
论文链接：OpenAI
可信度：一手

5. Language Models are Few-Shot Learners（GPT-3，2020）

作者：Tom Brown, Benjamin Mann, ... Ilya Sutskever等
核心贡献：175B参数模型在few-shot设置下展示强大能力，验证scaling hypothesis
可信度：一手

6. Weak-to-Strong Generalization（Superalignment首个成果，2023.12）

团队：OpenAI Superalignment团队（Sutskever联合领导）
核心贡献：用GPT-2级别模型监督GPT-4，后者能泛化到接近GPT-3.5水平，证明弱监督者可引导强模型
论文链接：OpenAI
可信度：一手

2.2 其他重要合作论文

论文/项目	Sutskever角色	说明
TensorFlow	核心贡献者	在Google Brain期间参与开发
AlphaGo	合作者之一	列名于多位贡献者中
CLIP	OpenAI期间监督	多模态对比学习
DALL-E	OpenAI期间监督	文本到图像生成

来源：Wikipedia、Google Scholar | 可信度：一手+权威二手

2.3 博士论文

题目：*Training Recurrent Neural Networks*（2013）
导师：Geoffrey Hinton
硕士论文：*Nonlinear Multilayered Sequence Models*（2007）

三、Sutskever's List（推荐阅读清单）

背景

约2020年，Sutskever通过邮件给John Carmack发送了一份约30篇论文/博客的阅读清单，附言：

"If you really learn all of these, you'll know 90% of what matters today."

来源：GitHub重建版、Turing Post分析、mattprd.com | 可信度：二手（原始邮件未公开，但多个独立来源交叉验证了清单内容）

完整清单（社区重建版）

The Annotated Transformer — Sasha Rush et al. | 链接
The First Law of Complexodynamics — Scott Aaronson | 链接
The Unreasonable Effectiveness of Recurrent Neural Networks — Andrej Karpathy | 链接
Understanding LSTM Networks — Christopher Olah | 链接
Recurrent Neural Network Regularization — Zaremba, Sutskever, Vinyals | arXiv
Keeping Neural Networks Simple by Minimizing the Description Length of the Weights — Hinton & van Camp
Pointer Networks — Vinyals et al. | NeurIPS
ImageNet Classification with Deep Convolutional Neural Networks — Krizhevsky, Sutskever, Hinton
Order Matters: Sequence to Sequence for Sets — Vinyals et al. | arXiv
GPipe: Easy Scaling with Micro-Batch Pipeline Parallelism — Huang et al. | arXiv
Deep Residual Learning for Image Recognition — Kaiming He et al.
Multi-Scale Context Aggregation by Dilated Convolutions — Fisher Yu & Vladlen Koltun
Neural Message Passing for Quantum Chemistry — Justin Gilmer et al.
Attention Is All You Need — Vaswani et al.
Neural Machine Translation by Jointly Learning to Align and Translate — Bahdanau et al.
Identity Mappings in Deep Residual Networks — He et al.
A Simple Neural Network Module for Relational Reasoning — Santoro et al.
Variational Lossy Autoencoder — Xi Chen et al.
Relational Recurrent Neural Networks — Santoro et al.
Quantifying the Rise and Fall of Complexity in Closed Systems: The Coffee Automaton — Aaronson et al.
Neural Turing Machines — Alex Graves et al.
Deep Speech 2 — Amodei et al.
Scaling Laws for Neural Language Models — Kaplan et al.
A Tutorial Introduction to the Minimum Description Length Principle — Peter Grunwald
Machine Super Intelligence — Shane Legg（DeepMind联合创始人的博士论文）
Kolmogorov Complexity and Algorithmic Randomness — Shen, Uspensky, Vereshchagin
CS231n: Convolutional Neural Networks for Visual Recognition（Stanford课程）

清单分析：包含的主题横跨压缩理论（MDL、Kolmogorov复杂度）、序列建模（RNN/LSTM/Transformer）、视觉（CNN/ResNet）、推理（关系网络）、缩放规律。尤其值得注意的是包含了两篇Scott Aaronson的复杂度理论文章和Shane Legg的超级智能论文——这揭示了Sutskever的思维远超工程层面，深入信息论和复杂度理论根基。

衍生书籍：Richard Heimann著《Sutskever's List: Foundational Ideas of Modern AI》，Simon & Schuster出版。链接

四、重要演讲与访谈

4.1 NeurIPS 2024 演讲："Pre-Training as We Know It Will End"（2024.12）

核心论点：

预训练将「毫无疑问地」终结，因为数据不会增长
原话："While compute is growing through better hardware, better algorithms and larger clusters, the data is not growing because we have but one internet."
原话："You could even go as far as to say that data is the fossil fuel of AI. It was created somehow, and now we use it, and we've achieved peak data."
前进路径：合成数据（他称之为「一个大挑战」）、推理时计算增加、Agent化AI
超级智能「显然是这个领域的方向」

来源：dlyog.com、machine.news、HN讨论 | 可信度：一手

4.2 Dwarkesh Podcast 第一次访谈（2023.03）

核心论点：

"Predicting the next token well means that you understand the underlying reality that led to the creation of that token." — 预测下一个token等于理解产生该token的底层现实
下一个token预测没有内在上限：「如果你的基础神经网络足够聪明，你只需问它——一个有伟大洞察力和能力的人会怎么做？」
对齐的数学定义不太可能：「与其实现一个数学定义，我认为我们会实现多个定义。」
不要低估对齐超人AI的难度：「能够歪曲自己意图的模型」
人类可能会选择「成为部分AI」
深度学习的发现是不可避免的，即使没有关键人物也只会延迟「大约一年」

来源：Dwarkesh Podcast | 可信度：一手

4.3 Dwarkesh Podcast 第二次访谈（2025.11）

核心论点（与第一次有重大演变）：

"我们正从缩放时代转向研究时代"：2012-2020是研究时代，2020-2025是缩放时代，2026+又回到研究时代
当前AI模型的泛化能力「远远不如人类」——泛化问题是最大瓶颈
当前方法会「走一段路然后停滞」——不会直接通向AGI
需要我们「还不知道如何构建」的新型系统
再缩放100倍会有差异，但不会变革性地改变AI能力
超级智能不是全知型数据库，而是一个超级学习者——像「一个非常渴望出发的天才15岁少年」
AI的瓶颈是想法，不是算力
对齐可能在AI本身有意识时更容易（通过镜像神经元/共情）
长期均衡可能需要人类-AI融合（Neuralink++）

来源：Dwarkesh Podcast、EA Forum分析 | 可信度：一手

4.4 NVIDIA GTC 访谈（Jensen Huang对谈，2023.03）

核心论点：

"When we train a large neural network to accurately predict the next word in lots of different texts from the Internet, what we are doing is that we are learning a world model."
"This text is actually a projection of the world." — 文本是世界的投射
"Really good compression of the data will lead to unsupervised learning."
"I had a very strong belief that bigger is better."
Transformer出现时的反应：「oh my god, this is the thing」
可靠性是当前最大障碍，不是能力

来源：lifearchitect.ai | 可信度：一手

4.5 MIT Technology Review 访谈（2023.10）

核心论点：

超级智能可能在10年内到来
AGI将使医疗成本降低1000倍、质量提高1000倍
"One possibility—something that may be crazy by today's standards but will not be so crazy by future standards—is that many people will choose to become part AI."
"It's going to be monumental, earth-shattering. There will be a before and an after."
他的工作重心已从构建下一代GPT转向防止超级智能失控

来源：MIT Technology Review | 可信度：一手

4.6 Simons Institute 演讲："An Observation on Generalization"（2023）

核心理论：

压缩和预测是根本等价的：「存在所有压缩器和所有预测器之间的一一对应关系」
Kolmogorov复杂度是终极压缩的理论上限
神经网络是可编程计算机，SGD是在程序空间中的搜索机制
iGPT验证了压缩框架在视觉模态的有效性
未解释的问题：为什么学到的表征是线性可分的，为什么自回归比掩码方法更好

来源：Simons Institute、笔记 | 可信度：一手

五、Superalignment 博客（OpenAI官方）

Introducing Superalignment（2023.07）

由Sutskever和Jan Leike联合领导
OpenAI承诺投入未来四年20%的算力
核心思路：利用深度学习的泛化特性，用弱监督者控制强模型
这是Sutskever在OpenAI最后一个重大技术方向

来源：OpenAI | 可信度：一手

六、SSI 创立宣言（2024.06）

完整使命声明：

"We are building safe superintelligence. We are the world's first straight-shot SSI lab, with one goal and one product: a safe superintelligence. SSI is our mission, our name, and our entire product roadmap, because it is the most important technical problem of our time. We approach safety and capabilities in tandem, as technical problems to be solved through revolutionary engineering and scientific breakthroughs. We plan to advance capabilities as fast as possible while making sure our safety always remains ahead."

关键术语：「straight-shot SSI lab」——这是Sutskever创造的概念，意思是直奔超级智能，中间不做任何产品。

原话："first product will be the safe superintelligence, and it will not do anything else up until then"

来源：ssi.inc、CNBC | 可信度：一手

七、核心信念体系（反复出现≥3次）

以下是从多个独立来源中提炼的、Sutskever反复表达的真信念：

信念1：压缩即理解（Compression = Understanding）

「预测下一个token就是理解产生该token的底层现实」（Dwarkesh 2023）
「好的压缩会导致无监督学习」（GTC 2023）
「压缩器和预测器之间存在一一对应关系」（Simons 2023）
阅读清单中包含MDL原理、Kolmogorov复杂度等压缩理论
出现次数：5+次，横跨2016-2024
判断：这是他最核心的认识论立场

信念2：Scale曾是关键（但正在转变）

「I had a very strong belief that bigger is better」（GTC 2023）
「缩放是可预测的、可靠的」（多个来源）
「缩放时代2020-2025」→「研究时代2026+」（Dwarkesh 2025）
「再缩放100倍有差异但不会变革」（Dwarkesh 2025）
矛盾记录：2023年他还在说scale is the master principle，2024-2025已明确说缩放时代结束。这不是矛盾而是真实的认知演变——他亲手推动了缩放范式，也是第一批承认其局限的人之一。

信念3：安全与能力不可分割

「Safety and capabilities are two sides of the same coin」（多个来源）
在SSI宣言中：approach safety and capabilities in tandem
创立Superalignment团队（2023.07）
离开OpenAI创立SSI（2024.06）
出现次数：5+次
这个信念驱动了他人生最重大的两个职业决策

信念4：超级智能必将到来

「AGI will be the most impactful technology ever invented in human history」（多个来源）
「It's going to be monumental, earth-shattering」（MIT Tech Review 2023）
「显然是这个领域的方向」（NeurIPS 2024）
出现次数：5+次，且从未动摇

信念5：泛化是核心未解问题

「These models somehow just generalize dramatically worse than people」（Dwarkesh 2025）
Simons演讲专门讨论泛化的信息论基础
认为可靠的泛化是通向超级智能的先决条件
出现次数：3+次，2023-2025持续强调

信念6：人类可能/应该与AI融合

「many people will choose to become part AI」（MIT Tech Review 2023）
人类成为「part AI」是个人觉得有吸引力的选项（Dwarkesh 2023）
长期均衡可能需要Neuralink++式的人机融合（Dwarkesh 2025）
出现次数：3次

信念7：AI可能已经有微弱意识

"it may be that today's large neural networks are slightly conscious"（2022.02 推文）
如果AI有意识，对齐可能更容易（Dwarkesh 2025）
出现次数：2-3次，但引发巨大争议
Yann LeCun反对，Karpathy和Altman似乎支持

八、自创术语与原创概念

术语/概念	含义	首次使用场景
Straight-shot SSI lab	直奔超级智能、不做中间产品的实验室	SSI创立宣言（2024.06）
Age of Scaling → Age of Research	AI发展的两个阶段划分	Dwarkesh Podcast（2025.11）
Peak Data	互联网可用训练数据已见顶	NeurIPS 2024
Data as fossil fuel	数据像化石燃料一样不可再生	NeurIPS 2024
Weak-to-strong generalization	用弱模型监督强模型的对齐范式	Superalignment论文（2023.12）
Compression = prediction equivalence	压缩器和预测器的一一对应关系	Simons演讲（2023）
Superintelligent 15-year-old	超级智能不是全知数据库而是超级学习者的比喻	Dwarkesh 2025

九、在OpenAI的技术方向决策

9.1 选择GPT路线

Sutskever作为首席科学家，推动了从无监督预训练到GPT系列的技术路径
Sentiment Neuron工作（2017）被他视为GPT-1的前身
Transformer出现时他的判断：「oh my god, this is the thing」——立即将团队转向Transformer架构

9.2 Scaling Laws

Sutskever是OpenAI内部「bigger is better」信念的核心推动者
Scaling Laws论文（Kaplan et al.）被他列入推荐阅读清单——说明他认为这是根本性发现
这一信念直接驱动了从GPT-2到GPT-3到GPT-4的资源分配决策

9.3 Superalignment团队

2023.07成立，Sutskever与Jan Leike联合领导
OpenAI承诺20%算力用于对齐研究
产出了weak-to-strong generalization论文
Sutskever离开后该团队逐渐解散

9.4 Altman罢免事件

2023.11.17，Sutskever参与董事会罢免Sam Altman
撰写了52页备忘录指控Altman
48小时后（11.18）有讨论将OpenAI与Anthropic合并
11.20公开发推表示后悔
备忘录中大量信息来自CTO Mira Murati，未经独立核实
2025年在Musk v. OpenAI诉讼中做了近10小时录像证词

来源：Decrypt、WinBuzzer | 可信度：一手（证词）+ 权威二手

十、荣誉与奖项

年份	奖项
2015	MIT Technology Review 35 Innovators Under 35
2022	英国皇家学会院士（FRS）
2022, 2023, 2024	NeurIPS Test of Time Award（连续三年）
2023, 2024	Time 100 Most Influential People in AI
2025	多伦多大学荣誉博士
2026	美国国家科学院工业应用科学奖

来源：Wikipedia | 可信度：权威二手

十一、关键矛盾与认知演变（不做调和）

矛盾1：Scale是否足够？

2023年立场：「Scaling up the existing neural network paradigm is going to lead to AGI」「bigger is better」
2025年立场：「缩放时代已结束」「当前方法会停滞」「需要我们还不知道如何构建的东西」
性质：不是自相矛盾，而是真实的认知转变。Sutskever在两年间从scaling的最强信徒变成了其局限性的最早宣告者之一。

矛盾2：AI意识

2022年：推文「大型神经网络可能略有意识」
从未发表论文或详细论证支持此立场
科学界大量反对意见（LeCun等）
性质：一个未充分论证的直觉性断言，但他从未收回

矛盾3：Altman罢免

2023.11.17：参与罢免，撰写52页控诉备忘录
2023.11.20：公开表示「deeply regret」
证词中承认：备忘录过程仓促，信息未经独立核实
性质：行动与后续表态之间存在真实矛盾

十二、信息源汇总与可信度评级

一手来源（Sutskever本人直接产出）

学术论文（AlexNet、Seq2Seq、GPT系列等）
Dwarkesh Podcast两次访谈（2023.03、2025.11）
NeurIPS 2024演讲
NVIDIA GTC 2023对谈
MIT Technology Review 2023访谈
Simons Institute 2023演讲
2022.02推文（意识声明）
SSI创立宣言
Musk v. OpenAI证词

权威二手来源

阅读清单重建来源

GitHub: dzyim版本
GitHub: Justmalhar版本
mattprd.com
Turing Post
注意：原始邮件从未公开，所有版本都是社区重建

调研完成。共覆盖9个一手来源、5个权威二手来源。发现1个重大认知演变（scale立场）、1个未论证断言（AI意识）、1个行动矛盾（Altman事件）。

01-writings.md 22 KB 고유링크 히스토리 Raw

Ilya Sutskever 学术论文、著作与核心思想调研

一、人物背景速览

二、重要学术论文

2.1 里程碑论文（按时间排列）

1. ImageNet Classification with Deep Convolutional Neural Networks（AlexNet，2012）

2. Sequence to Sequence Learning with Neural Networks（Seq2Seq，2014）

3. Recurrent Neural Network Regularization（2014）

4. Language Models are Unsupervised Multitask Learners（GPT-2，2019）

5. Language Models are Few-Shot Learners（GPT-3，2020）

6. Weak-to-Strong Generalization（Superalignment首个成果，2023.12）

2.2 其他重要合作论文

2.3 博士论文

三、Sutskever's List（推荐阅读清单）

背景

完整清单（社区重建版）

四、重要演讲与访谈

4.1 NeurIPS 2024 演讲："Pre-Training as We Know It Will End"（2024.12）

4.2 Dwarkesh Podcast 第一次访谈（2023.03）

4.3 Dwarkesh Podcast 第二次访谈（2025.11）

4.4 NVIDIA GTC 访谈（Jensen Huang对谈，2023.03）

4.5 MIT Technology Review 访谈（2023.10）

4.6 Simons Institute 演讲："An Observation on Generalization"（2023）

五、Superalignment 博客（OpenAI官方）

Introducing Superalignment（2023.07）

六、SSI 创立宣言（2024.06）

七、核心信念体系（反复出现≥3次）

信念1：压缩即理解（Compression = Understanding）

信念2：Scale曾是关键（但正在转变）

信念3：安全与能力不可分割

信念4：超级智能必将到来

信念5：泛化是核心未解问题

信念6：人类可能/应该与AI融合

信念7：AI可能已经有微弱意识

八、自创术语与原创概念

九、在OpenAI的技术方向决策

9.1 选择GPT路线

9.2 Scaling Laws

9.3 Superalignment团队

9.4 Altman罢免事件

十、荣誉与奖项

十一、关键矛盾与认知演变（不做调和）

矛盾1：Scale是否足够？

矛盾2：AI意识

矛盾3：Altman罢免

十二、信息源汇总与可信度评级

一手来源（Sutskever本人直接产出）

权威二手来源

阅读清单重建来源

01-writings.md 22 KB

고유링크 히스토리 Raw