谢赛宁的反叛：世界模型背后，一个独立技术人的生存哲学|dtsola

来源：B站「张小珺商业访谈录」——《对谢赛宁的7小时马拉松访谈：世界模型、逃出硅谷、反OpenAI、AMI Labs、两次拒绝Ilya、杨立昆、李飞飞和42》

📌 为什么我要分享这篇访谈

作为一名 IT 解决方案架构师，同时也是一人公司的实践者，我每天面对的问题，往往不只是技术本身，更多是：在一个被大厂和资本裹挟的时代，一个独立的技术人，应该怎样找到自己的方向？

我们这个行业，太容易被"正确答案"绑架了。什么是好的技术路线？什么是值得做的方向？什么是"聪明人"该走的路？大厂、资本、KOL，每天都在给你答案。久而久之，你开始怀疑：我真正相信的是什么？

当我看完谢赛宁这7小时的访谈，我有一种久违的震动感。

他不是那种"天才叙事"里的主角——不是竞赛金牌得主，不是一路名校直通车，他自称是"B class学生"，走了很多弯路，拒绝了很多"正确选择"。但正是这些弯路，让他成为了今天的谢赛宁：ResNet 的核心作者之一、MAE 的提出者、两次拒绝 Ilya 的人，以及和杨立昆一起创立 AMI Labs 的联合创始人。

这篇文章，我尽量保留访谈的原汁原味，只在开头说明我分享的原因，在结尾做总结前后呼应。这是我近年来看过的，最值得技术人细读的一次对话。

一、The Normal One：一个不走寻常路的人

访谈发生在纽约布鲁克林的 Dumbo 区。这里不是时代广场那种游客扎堆的纽约，而是充满艺术气息和生活气息的纽约。谢赛宁说他喜欢这里，因为它更真实。

这是他人生中第一次接受播客访谈。

主持人张小珺问他：你在网上有大量的学术演讲和会议发言，为什么这么多年从没上过一个播客，做过一次访谈？

他沉默了几秒，然后说：

"可能是因为比较爱人，觉得不知道哪些话应该说，哪些话值得说，哪些话大家愿意听。但现在慢慢，年龄大了之后，也拥有了不被人喜欢的勇气。"

这句话，定下了整个访谈的基调。不是表演，不是人设，而是一个真实的人，在说他真实的想法。

谢赛宁的成长，是一个典型的"非标准路径"。父亲是心理学背景出身，后来做传媒工作，小时候他对父亲最深的印象是"扛着摄像机到处跑"；母亲做生意，带着他四处旅游，四川、上海，各种地方。家里书房几面墙都是书，父亲是个"纯粹的宅男，从来不出门，但最爱看书"。

这两种基因同时流淌在他身上：一种是向外探索的好奇心，一种是向内阅读的沉静。

九岁有了第一台电脑，他没有用来做正事，而是一盒一盒地买游戏来打。后来有了互联网，第一次感受到"信息爆炸"，开始在 BBS 上发表意见，写新浪博客，用饭否（一个早期社交媒体平台，很多人可能没听说过）发表万字长文。

他说那时候是"为赋新词强说愁"，回头看都会觉得好笑。但那种表达的欲望，从未消失过。他说，互联网的爆炸式增长，让他变成了一个对很多事情都很感兴趣的人。

这种对世界的广泛好奇，是他后来能跨越视觉、语言、神经科学等多个领域的根源。他不是那种从小就"规划好人生"的人，他的关键词，从一开始就是：好奇、随机、开放。

二、世界总不让我做 Vision

保送上海交大 A3 班，是谢赛宁人生的第一个重要转折点。但他说，这件事本身也充满了偶然。

他本来应该参加高考，老师说他成绩不错，应该冲清华北大。但他内心的想法很简单：

"交大挺好，我去上海待过，我觉得我跟这个城市、跟这个学校都气质相投，并且我就是想学计算机。"

进入 A3 班之前，有一个夏令营式的选拔面试。主持面试的是沈少教授，他问的不是技术题，而是："你喜欢读什么书？"

谢赛宁当时有点慌，但想起最近刚看完一本书，叫《What is Mathematics》（什么是数学）。沈少教授接着问：这本书的作者是谁？

谢赛宁想了很久，最终说出来了：Richard Courant（理查德·柯朗）。

沈少教授说："你要记住这个名字，因为这是20世纪最伟大的英文数学家之一。"

多年后，谢赛宁来到 NYU，加入的正是柯朗数学科学研究所（Courant Institute of Mathematical Sciences）——就是 Richard Courant 亲手创立的这个系。

他说，这件事让他觉得冥冥之中有些缘分。

进入 A3 班之后，他遇到了影响他一生的学长——侯小迪。侯小迪做了两件传奇的事：一是作为本科生发表了一篇 CVPR 论文，算法只有七行代码，却解决了一个重要的视觉问题；二是写了一本《交大生存手册》，里面有一句话让谢赛宁至今记得：

"如果一个人把绩点评分作为自己的至高追求，那么他就是这个政策的牺牲品。"

这本手册，某种程度上重塑了谢赛宁对"学习"和"研究"的认知——学习不是为了分数，研究不是为了发论文，而是为了真正理解这个世界。

大三实习，A3 班的默认路径是去微软亚研院（MSRA）。但谢赛宁想做计算机视觉，而 MSRA 当时的视觉方向不对口。于是他做了一个"出格"的决定：自己发邮件，联系新加坡国立大学严水成老师的实验室，什么都没告诉班主任于老师。

等到拿到 offer，才去汇报。班主任当然不高兴，但他已经决定了。

这种"先斩后奏"的行动力，贯穿了他整个职业生涯。他后来总结这段经历时说：

"这个世界总不让我做我想做的事情，但我偏偏要做。"

为什么他如此执着于视觉？他在访谈中说了一句让我印象极深的话：

"眼睛是唯一暴露在真实世界里的大脑。"

视觉不只是感知，它是智能与物理世界之间最直接的接口。这个判断，在十几年后，成为了他创立 AMI Labs、研究世界模型的核心信念。

三、学术流浪与何恺明的友谊

博士申请，险些失学。

谢赛宁申请了很多学校，结果并不理想。最终被涂老师（图周恩）"捞起来"，进入 UCLA。后来涂老师转去 UCSD，他跟着转学。他对这个决定的解释非常简单：

"重要的是跟谁做什么事，不是在哪里。"

这句话，对于今天很多纠结于平台、公司、城市的年轻技术人，是一剂清醒药。

博士期间，他做了五次实习：NEC Lab、Adobe、Meta/FAIR、Google Research、DeepMind。他开着一辆破车，在南北湾区之间往返，被朋友戏称为"流浪式研究员"。每一次实习，他都在接触不同的问题、不同的人、不同的研究文化。

其中最重要的一次，是在 Meta/FAIR 遇见了何恺明。

那时候何恺明刚到美国不久，英语还不太流利，也不会用 Linux。谢赛宁教他用 Linux，开车带他去吃饭。两个人一拍即合，仅仅一个月内就合作完成了 ResNeXt——一篇后来被引用数万次的深度学习论文。

谢赛宁描述何恺明时，用了一个词："现实扭曲引力场"——

"跟他在一起，你会觉得做什么事情都是可能的。他有一种魔力，让你觉得这个问题值得被解决，而且你们两个人现在就可以解决它。"

这种描述，让我想起了乔布斯。真正顶级的创造者，都有这种能力：让身边的人相信不可能是可能的。

何恺明给他的建议也影响深远：

"去不同的地方实习，最大化你的收获。不要只待在一个地方。"

这段友谊，是谢赛宁学术生涯里最重要的一条线索。后来他们合作的 MAE（Masked Autoencoders，掩码自编码器），被认为是自监督学习领域的里程碑工作，影响了整整一代视觉模型的设计思路。

四、两次拒绝 Ilya，以及杨立昆与李飞飞

博士毕业后，谢赛宁面临人生最重要的选择之一。

Ilya Sutskever——OpenAI 的联合创始人，GPT 系列背后最核心的技术大脑之一——两次向他抛出橄榄枝，两次都被他拒绝了。

这在 AI 圈是一件颇为轰动的事。毕竟，那个时候 OpenAI 已经是全球最炙手可热的 AI 公司，Ilya 的邀请几乎等同于一张通往 AI 历史中心的入场券。

他没有详细解释拒绝的全部原因，但言语之间透露出一种清醒的判断：他对 OpenAI 所走的技术路线，有根本性的疑虑。 他认为，纯粹依赖语言模型的 Scaling（规模扩展），并不是通向真正智能的正确路径。这不是对 OpenAI 能力的否定，而是对方向的分歧。

这种分歧，在他后来创立 AMI Labs 时，变成了一种公开的宣言。

与此同时，他与杨立昆（Yann LeCun）和李飞飞都有过深度交集。

他描述杨立昆时，充满了真实的喜爱和欣赏：

"他有四大爱好：模型飞机、天文摄影、电子乐、帆船。他就像一个16岁的青春期少年，这种状态一直延续到65岁。"

这种对世界永不熄灭的好奇心，正是谢赛宁最欣赏的人格特质。杨立昆是深度学习的奠基人之一，图灵奖得主，但他从不把自己框在某一个"正确答案"里。他公开质疑 LLM 的局限性，坚持认为世界模型才是 AGI 的正确路径——哪怕这让他在硅谷显得格格不入。

也正是这种气质上的深度契合，让谢赛宁和杨立昆走到了一起，共同创立了 AMI Labs。

五、草蛇灰线：表征的世界与 Research Taste

如果你把谢赛宁的研究生涯拉成一条时间线，表面上看起来很"散"：边缘检测、图像分割、深度估计、自监督学习、世界模型……跨度极大，似乎没有一条清晰的主线。

但他说，这其实是一条隐藏的主线，贯穿始终：

"我一直在问同一个问题：神经网络到底在学什么？它的每一层，到底在表达什么？"

这就是他所说的"表征"（Representation）——不是模型的输出结果，而是模型内部对世界的理解方式。就像一个人学会了骑自行车，他的大脑里形成的那种"平衡感"，才是真正的知识，而不是他骑车的动作本身。

他用《金刚经》来类比自己的 research taste：

"应无所住而生其心。做研究不能执着于某一个具体的方法或者结果，但内心要有一个清晰的问题在驱动你。"

这句话，对于很多陷入"发论文焦虑"的研究者来说，是一种解脱，也是一种更高的要求。不执着于方法，意味着你要有足够的自信去放弃已经成功的路；有清晰的问题，意味着你要有足够的诚实去承认自己真正在追求什么。

他还说了一句让我印象极深的话：

"你不做这件事，这件事在世界上永远不会发生。"

这不是自大，而是一种对研究者责任感的清醒认知。每一个真正的研究问题，都需要有人愿意在没有地图的情况下，走进那片未知的森林。没有人会替你去问那个问题，没有人会替你去找那个答案。

他说，好的 research taste，就是能在一片混沌中，感知到哪个问题是真正重要的，哪条路是值得走的——哪怕当时没有人相信你。

这种判断力，不是靠刷题刷出来的，而是靠大量阅读、大量思考、大量失败积累出来的。这也是为什么他说自己是"B class学生"，却能做出 A class 的工作——因为他从来不是在为分数而学，而是在为问题而活。

六、世界模型、下载人类，与"硅谷被催眠了"

访谈的后半段，谢赛宁开始谈他真正相信的东西。这也是整个访谈最有分量的部分。

世界模型（World Model）是什么？

他的定义很清晰：不是一个能回答问题的系统，而是一个能理解物理世界因果关系的系统。它需要知道：如果我推这个杯子，它会掉下去；如果下雨，地面会湿；如果我说一句话，对方可能会有什么反应。这些常识性的因果理解，是人类智能的基础，但语言模型学不到，因为它从未真正"看见"过、"触摸"过这个世界。

他对 LLM（大语言模型）的判断，犀利而直接：

"LLM 可能没有在理解人，它只是人的一个反射。就像《索拉里斯》里的海洋，它读取了你的潜意识，然后把你最深处的东西投射回来给你看。你以为它在理解你，其实它只是你自己的镜子。"

《索拉里斯》是苏联科幻作家斯坦尼斯拉夫·莱姆的经典小说，后来被塔可夫斯基拍成电影。故事里有一片神秘的海洋，它能读取宇航员的记忆和潜意识，然后把他们最深处的执念具象化呈现出来。你以为你在跟一个真实的存在对话，其实你只是在跟自己的投影对话。

这个比喻，精准地击中了 LLM 的本质局限。

他用了一个更大的框架来描述这个问题："从下载互联网，到下载人类。"

LLM 做到了前者——它压缩了人类在互联网上留下的所有文字，把人类的语言模式、知识结构、思维习惯都编码进了模型的参数里。但这只是"下载了互联网"，而不是"下载了人类"。真正的人类智能，还包括感知、行动、在物理世界中生存的能力——这些，语言模型永远无法从文字中学到。

这也是他离开大厂、和杨立昆共同创立 AMI Labs 的根本原因。

AMI Labs 有6位联合创始人，融资规模约3亿美元。他们选择在纽约而非硅谷创业，这个选择本身就是一种宣言。

谢赛宁说：

"硅谷现在被催眠了。所有人都在做同一件事，都在 Scaling，都在相信同一条路。被催眠的人总会醒来，但醒来的时候可能已经很晚了。"

他们选择做 underdog，选择走一条更难、但他们相信更正确的路。纽约不是硅谷，没有那种集体催眠的氛围，反而给了他们一种清醒的距离感。

这让我想起一个规律：真正的颠覆性创新，往往不是从中心发生的，而是从边缘发生的。 因为中心太拥挤，太嘈杂，太容易被主流叙事裹挟。边缘反而有空间去想那些"不合时宜"的问题。

七、自大的人类，与"42"

访谈接近尾声，谢赛宁谈到了一个更宏大的命题：人类在宇宙中的位置。

他提到寒武纪大爆发——大约5亿年前，生物突然进化出了眼睛。视觉的出现，让物种能够感知更复杂的环境，做出更复杂的判断，物种多样性因此爆炸式增长。他认为，AI 视觉能力的突破，可能正在触发一次类似的"认知寒武纪"——当机器真正能够"看见"并理解这个世界，整个智能的版图将会被重写。

但他同时也发出了一个警告：

"人类太自大了。我们总以为自己是宇宙的中心，总以为智能只有一种形式，总以为我们现在走的这条路就是唯一正确的路。但也许，我们只是这个宇宙里一个非常局部的、非常短暂的存在。"

这种谦逊，不是虚伪的谦虚，而是真正的科学精神——承认自己的无知，才能真正去探索未知。

最后，是公司名字"42"的来源。

来自道格拉斯·亚当斯的科幻小说《银河系漫游指南》：一台名为"深思"的超级计算机，被问到"宇宙、生命与万物的终极答案是什么"，经过750万年的计算，它给出的答案是——42。

但没有人知道，那个问题究竟是什么。

谢赛宁说：

"我们不知道问题是什么，但我们在寻找答案。这就是我们在做的事情。"

这句话，是整个7小时访谈最好的注脚。AI 研究的本质，不是给出答案，而是找到那个真正值得被问的问题。而 AMI Labs，就是他们寻找那个问题的方式。

💬 值得反复咀嚼的金句

访谈中有太多值得记录的话，以下是我认为最有分量的几句，每一句都值得单独思考：

"年龄大了之后，拥有了不被人喜欢的勇气。"
这是一种成熟。年轻时我们太在意别人的眼光，太想被认可，反而失去了说真话的能力。

"这个世界总不让我做我想做的事情，但我偏偏要做。"
这不是叛逆，而是一种对自我判断的信任。

"重要的是跟谁做什么事，不是在哪里。"
平台不重要，人和问题才重要。

"如果一个人把绩点评分作为自己的至高追求，那么他就是这个政策的牺牲品。"
这句话不只适用于学生，也适用于每一个用 KPI 来定义自己价值的人。

"你不做这件事，这件事在世界上永远不会发生。"
这是一种责任感，也是一种对自己独特性的认可。

"应无所住而生其心。"
不执着于方法，但要有清晰的问题驱动你。

"LLM 只是人的一个反射，它是你自己的镜子。"
这是对 AI 本质局限最精准的一句描述。

"硅谷被催眠了。被催眠的人总会醒来，但醒来的时候可能已经很晚了。"
这句话，不只是在说硅谷，也是在说每一个跟风的人。

"我们不知道问题是什么，但我们在寻找答案。"
这是科学精神，也是人生哲学。

🧭 对一人公司的启发

看完这个访谈，我反复在想：谢赛宁的故事，和一人公司的逻辑，其实是同构的。

他不是在一个大组织里按部就班地往上爬，而是一个人带着一个问题，在不同的地方、不同的人之间流浪、碰撞、生长。这和一人公司的本质何其相似——你没有组织的庇护，没有团队的分工，有的只是你自己对某个问题的判断，和把这个判断变成现实的行动力。

这里有几条我认为对一人公司最有价值的启发：

1. 找到你的"隐藏主线"，而不是追热点

谢赛宁的研究看起来很散，但其实一直在问同一个问题。一人公司也是如此——你不可能什么都做，你必须找到那条只属于你的主线。不是市场最热的方向，不是别人都在做的事，而是那个你愿意用五年、十年去深挖的问题。

主线找到了，你才有定力在别人都在跟风的时候，继续做自己的事。

2. "先斩后奏"的行动力，是一人公司的核心竞争力

他大三实习，不等批准，先发邮件，拿到 offer 再汇报。这种行动力，在大公司里可能是"不合规矩"，但在一人公司里，它是生存的基础。

一人公司没有委员会，没有审批流程，你的速度就是你的护城河。想到就做，做了再说，错了再改——这是一人公司对抗大公司最重要的武器之一。

3. 关系比平台重要：跟谁做，比在哪里做更关键

他跟着导师从 UCLA 转到 UCSD，没有犹豫。因为他知道，真正重要的是人，不是学校的名字。

对一人公司来说，这一点尤其关键。你的客户、合作伙伴、同行圈子，才是你真正的"平台"。选择和谁合作，比选择在哪个平台上发布内容，重要得多。一个真正认可你价值的客户，抵得上一百个泛泛的流量。

4. 做 underdog，是一种战略选择，不是一种委屈

谢赛宁和杨立昆选择在纽约创业，拒绝硅谷的集体催眠。这不是因为他们去不了硅谷，而是因为他们清楚地知道：在主流的喧嚣里，你很难听见自己内心的声音。

一人公司天然就是 underdog。你没有大公司的品牌背书，没有融资的光环，没有团队的规模感。但这恰恰是你的优势——你可以做大公司不屑于做的小事，可以服务大公司忽视的小众需求，可以在别人都在争夺同一块蛋糕的时候，悄悄去烤一块不一样的。

5. 你的"42"是什么？

这是我看完整个访谈，最想问自己的问题。

谢赛宁用一生在寻找那个"真正值得被问的问题"。对一人公司来说，这个问题同样存在：你做这件事，究竟是为了什么？是为了赚钱？为了自由？为了证明什么？还是因为这件事本身，就是你觉得这个世界需要有人去做的？

答案没有对错。但你必须有答案。因为在一人公司最难熬的那些时刻——没有客户、没有反馈、没有人相信你——支撑你继续的，不是方法论，不是工具，而是那个让你"偏偏要做"的理由。

找到你的"42"。不是那个答案，而是那个问题。

📌 结尾

文章开头，我说自己每天面对的问题是：在一个被大厂和资本裹挟的时代，一个独立的技术人，应该怎样找到自己的方向？

看完谢赛宁的故事，我想我找到了一个不算答案的答案：

不是找到方向，而是找到那个让你"偏偏要做"的问题。

他不是最聪明的那个人，不是最顺利的那个人，但他是那个一直在问同一个问题的人。从交大书房里翻书的少年，到纽约布鲁克林谈世界模型的研究者，变的是身份和舞台，不变的是那份对"表征"、对"智能本质"的执念。

作为一人公司的实践者，我深知：独立，从来不是一种姿态，而是一种对自己诚实的选择。 你必须知道自己真正相信什么，才能在所有人都在跟风的时候，做出不一样的判断。

谢赛宁两次拒绝 Ilya，不是因为他不知道那意味着什么，而是因为他知道：如果你不做你真正相信的事，那你做的一切，都只是在帮别人实现他们的答案。

而我们，都需要找到自己的"42"。

不是那个答案，而是那个让你愿意用一生去追问的问题。

本文整理自 B站「张小珺商业访谈录」，原视频时长约7小时，强烈建议有时间的朋友去看完整版。

— dtsola｜IT解决方案架构师 | 一人公司实践者

如果这篇文章对你有帮助，欢迎点赞、收藏、转发。也欢迎在评论区分享你的经验，我们一起交流学习！

我是 dtsola【IT解决方案架构师 | 一人公司实践者】；专注AI创业、商业、技术、心理学、哲学内容分享。

提供服务：AI项目咨询 | 技术解决方案 | IT项目实施 | 企业技术顾问

博客：https://www.dtsola.com

公众号&VX：dtsola

需提供服务，加微信 dtsola，备注：IT咨询，并说明来意。

#独立开发者 #AI编程 #个人开发者 #一人公司 #程序员 #软件开发者 #创业者 #数字游民 #AI创业 #人工智能