来源:B站「张小珺商业访谈录」——《对谢赛宁的7小时马拉松访谈:世界模型、逃出硅谷、反OpenAI、AMI Labs、两次拒绝Ilya、杨立昆、李飞飞和42》


📌 为什么我要分享这篇访谈

作为一名 IT 解决方案架构师,同时也是一人公司的实践者,我每天面对的问题,往往不只是技术本身,更多是:在一个被大厂和资本裹挟的时代,一个独立的技术人,应该怎样找到自己的方向?

我们这个行业,太容易被"正确答案"绑架了。什么是好的技术路线?什么是值得做的方向?什么是"聪明人"该走的路?大厂、资本、KOL,每天都在给你答案。久而久之,你开始怀疑:我真正相信的是什么?

当我看完谢赛宁这7小时的访谈,我有一种久违的震动感。

他不是那种"天才叙事"里的主角——不是竞赛金牌得主,不是一路名校直通车,他自称是"B class学生",走了很多弯路,拒绝了很多"正确选择"。但正是这些弯路,让他成为了今天的谢赛宁:ResNet 的核心作者之一、MAE 的提出者、两次拒绝 Ilya 的人,以及和杨立昆一起创立 AMI Labs 的联合创始人。

这篇文章,我尽量保留访谈的原汁原味,只在开头说明我分享的原因,在结尾做总结前后呼应。这是我近年来看过的,最值得技术人细读的一次对话。


一、The Normal One:一个不走寻常路的人

访谈发生在纽约布鲁克林的 Dumbo 区。这里不是时代广场那种游客扎堆的纽约,而是充满艺术气息和生活气息的纽约。谢赛宁说他喜欢这里,因为它更真实。

这是他人生中第一次接受播客访谈

主持人张小珺问他:你在网上有大量的学术演讲和会议发言,为什么这么多年从没上过一个播客,做过一次访谈?

他沉默了几秒,然后说:

"可能是因为比较爱人,觉得不知道哪些话应该说,哪些话值得说,哪些话大家愿意听。但现在慢慢,年龄大了之后,也拥有了不被人喜欢的勇气。"

这句话,定下了整个访谈的基调。不是表演,不是人设,而是一个真实的人,在说他真实的想法。

谢赛宁的成长,是一个典型的"非标准路径"。父亲是心理学背景出身,后来做传媒工作,小时候他对父亲最深的印象是"扛着摄像机到处跑";母亲做生意,带着他四处旅游,四川、上海,各种地方。家里书房几面墙都是书,父亲是个"纯粹的宅男,从来不出门,但最爱看书"。

这两种基因同时流淌在他身上:一种是向外探索的好奇心,一种是向内阅读的沉静。

九岁有了第一台电脑,他没有用来做正事,而是一盒一盒地买游戏来打。后来有了互联网,第一次感受到"信息爆炸",开始在 BBS 上发表意见,写新浪博客,用饭否(一个早期社交媒体平台,很多人可能没听说过)发表万字长文。

他说那时候是"为赋新词强说愁",回头看都会觉得好笑。但那种表达的欲望,从未消失过。他说,互联网的爆炸式增长,让他变成了一个对很多事情都很感兴趣的人。

这种对世界的广泛好奇,是他后来能跨越视觉、语言、神经科学等多个领域的根源。他不是那种从小就"规划好人生"的人,他的关键词,从一开始就是:好奇、随机、开放。


二、世界总不让我做 Vision

保送上海交大 A3 班,是谢赛宁人生的第一个重要转折点。但他说,这件事本身也充满了偶然。

他本来应该参加高考,老师说他成绩不错,应该冲清华北大。但他内心的想法很简单:

"交大挺好,我去上海待过,我觉得我跟这个城市、跟这个学校都气质相投,并且我就是想学计算机。"

进入 A3 班之前,有一个夏令营式的选拔面试。主持面试的是沈少教授,他问的不是技术题,而是:"你喜欢读什么书?"

谢赛宁当时有点慌,但想起最近刚看完一本书,叫《What is Mathematics》(什么是数学)。沈少教授接着问:这本书的作者是谁?

谢赛宁想了很久,最终说出来了:Richard Courant(理查德·柯朗)。

沈少教授说:"你要记住这个名字,因为这是20世纪最伟大的英文数学家之一。"

多年后,谢赛宁来到 NYU,加入的正是柯朗数学科学研究所(Courant Institute of Mathematical Sciences)——就是 Richard Courant 亲手创立的这个系。

他说,这件事让他觉得冥冥之中有些缘分。

进入 A3 班之后,他遇到了影响他一生的学长——侯小迪。侯小迪做了两件传奇的事:一是作为本科生发表了一篇 CVPR 论文,算法只有七行代码,却解决了一个重要的视觉问题;二是写了一本《交大生存手册》,里面有一句话让谢赛宁至今记得:

"如果一个人把绩点评分作为自己的至高追求,那么他就是这个政策的牺牲品。"

这本手册,某种程度上重塑了谢赛宁对"学习"和"研究"的认知——学习不是为了分数,研究不是为了发论文,而是为了真正理解这个世界。

大三实习,A3 班的默认路径是去微软亚研院(MSRA)。但谢赛宁想做计算机视觉,而 MSRA 当时的视觉方向不对口。于是他做了一个"出格"的决定:自己发邮件,联系新加坡国立大学严水成老师的实验室,什么都没告诉班主任于老师。

等到拿到 offer,才去汇报。班主任当然不高兴,但他已经决定了。

这种"先斩后奏"的行动力,贯穿了他整个职业生涯。他后来总结这段经历时说:

"这个世界总不让我做我想做的事情,但我偏偏要做。"

为什么他如此执着于视觉?他在访谈中说了一句让我印象极深的话:

"眼睛是唯一暴露在真实世界里的大脑。"

视觉不只是感知,它是智能与物理世界之间最直接的接口。这个判断,在十几年后,成为了他创立 AMI Labs、研究世界模型的核心信念。


三、学术流浪与何恺明的友谊

博士申请,险些失学。

谢赛宁申请了很多学校,结果并不理想。最终被涂老师(图周恩)"捞起来",进入 UCLA。后来涂老师转去 UCSD,他跟着转学。他对这个决定的解释非常简单:

"重要的是跟谁做什么事,不是在哪里。"

这句话,对于今天很多纠结于平台、公司、城市的年轻技术人,是一剂清醒药。

博士期间,他做了五次实习:NEC Lab、Adobe、Meta/FAIR、Google Research、DeepMind。他开着一辆破车,在南北湾区之间往返,被朋友戏称为"流浪式研究员"。每一次实习,他都在接触不同的问题、不同的人、不同的研究文化。

其中最重要的一次,是在 Meta/FAIR 遇见了何恺明

那时候何恺明刚到美国不久,英语还不太流利,也不会用 Linux。谢赛宁教他用 Linux,开车带他去吃饭。两个人一拍即合,仅仅一个月内就合作完成了 ResNeXt——一篇后来被引用数万次的深度学习论文。

谢赛宁描述何恺明时,用了一个词:"现实扭曲引力场"——

"跟他在一起,你会觉得做什么事情都是可能的。他有一种魔力,让你觉得这个问题值得被解决,而且你们两个人现在就可以解决它。"

这种描述,让我想起了乔布斯。真正顶级的创造者,都有这种能力:让身边的人相信不可能是可能的。

何恺明给他的建议也影响深远:

"去不同的地方实习,最大化你的收获。不要只待在一个地方。"

这段友谊,是谢赛宁学术生涯里最重要的一条线索。后来他们合作的 MAE(Masked Autoencoders,掩码自编码器),被认为是自监督学习领域的里程碑工作,影响了整整一代视觉模型的设计思路。


四、两次拒绝 Ilya,以及杨立昆与李飞飞

博士毕业后,谢赛宁面临人生最重要的选择之一。

Ilya Sutskever——OpenAI 的联合创始人,GPT 系列背后最核心的技术大脑之一——两次向他抛出橄榄枝,两次都被他拒绝了。

这在 AI 圈是一件颇为轰动的事。毕竟,那个时候 OpenAI 已经是全球最炙手可热的 AI 公司,Ilya 的邀请几乎等同于一张通往 AI 历史中心的入场券。

他没有详细解释拒绝的全部原因,但言语之间透露出一种清醒的判断:他对 OpenAI 所走的技术路线,有根本性的疑虑。 他认为,纯粹依赖语言模型的 Scaling(规模扩展),并不是通向真正智能的正确路径。这不是对 OpenAI 能力的否定,而是对方向的分歧。

这种分歧,在他后来创立 AMI Labs 时,变成了一种公开的宣言。

与此同时,他与杨立昆(Yann LeCun)和李飞飞都有过深度交集。

他描述杨立昆时,充满了真实的喜爱和欣赏:

"他有四大爱好:模型飞机、天文摄影、电子乐、帆船。他就像一个16岁的青春期少年,这种状态一直延续到65岁。"

这种对世界永不熄灭的好奇心,正是谢赛宁最欣赏的人格特质。杨立昆是深度学习的奠基人之一,图灵奖得主,但他从不把自己框在某一个"正确答案"里。他公开质疑 LLM 的局限性,坚持认为世界模型才是 AGI 的正确路径——哪怕这让他在硅谷显得格格不入。

也正是这种气质上的深度契合,让谢赛宁和杨立昆走到了一起,共同创立了 AMI Labs。


五、草蛇灰线:表征的世界与 Research Taste

如果你把谢赛宁的研究生涯拉成一条时间线,表面上看起来很"散":边缘检测、图像分割、深度估计、自监督学习、世界模型……跨度极大,似乎没有一条清晰的主线。

但他说,这其实是一条隐藏的主线,贯穿始终:

"我一直在问同一个问题:神经网络到底在学什么?它的每一层,到底在表达什么?"

这就是他所说的"表征"(Representation)——不是模型的输出结果,而是模型内部对世界的理解方式。就像一个人学会了骑自行车,他的大脑里形成的那种"平衡感",才是真正的知识,而不是他骑车的动作本身。

他用《金刚经》来类比自己的 research taste:

"应无所住而生其心。做研究不能执着于某一个具体的方法或者结果,但内心要有一个清晰的问题在驱动你。"

这句话,对于很多陷入"发论文焦虑"的研究者来说,是一种解脱,也是一种更高的要求。不执着于方法,意味着你要有足够的自信去放弃已经成功的路;有清晰的问题,意味着你要有足够的诚实去承认自己真正在追求什么。

他还说了一句让我印象极深的话:

"你不做这件事,这件事在世界上永远不会发生。"

这不是自大,而是一种对研究者责任感的清醒认知。每一个真正的研究问题,都需要有人愿意在没有地图的情况下,走进那片未知的森林。没有人会替你去问那个问题,没有人会替你去找那个答案。

他说,好的 research taste,就是能在一片混沌中,感知到哪个问题是真正重要的,哪条路是值得走的——哪怕当时没有人相信你。

这种判断力,不是靠刷题刷出来的,而是靠大量阅读、大量思考、大量失败积累出来的。这也是为什么他说自己是"B class学生",却能做出 A class 的工作——因为他从来不是在为分数而学,而是在为问题而活。


六、世界模型、下载人类,与"硅谷被催眠了"

访谈的后半段,谢赛宁开始谈他真正相信的东西。这也是整个访谈最有分量的部分。

世界模型(World Model)是什么?

他的定义很清晰:不是一个能回答问题的系统,而是一个能理解物理世界因果关系的系统。它需要知道:如果我推这个杯子,它会掉下去;如果下雨,地面会湿;如果我说一句话,对方可能会有什么反应。这些常识性的因果理解,是人类智能的基础,但语言模型学不到,因为它从未真正"看见"过、"触摸"过这个世界。

他对 LLM(大语言模型)的判断,犀利而直接:

"LLM 可能没有在理解人,它只是人的一个反射。就像《索拉里斯》里的海洋,它读取了你的潜意识,然后把你最深处的东西投射回来给你看。你以为它在理解你,其实它只是你自己的镜子。"

《索拉里斯》是苏联科幻作家斯坦尼斯拉夫·莱姆的经典小说,后来被塔可夫斯基拍成电影。故事里有一片神秘的海洋,它能读取宇航员的记忆和潜意识,然后把他们最深处的执念具象化呈现出来。你以为你在跟一个真实的存在对话,其实你只是在跟自己的投影对话。

这个比喻,精准地击中了 LLM 的本质局限。

他用了一个更大的框架来描述这个问题:"从下载互联网,到下载人类。"

LLM 做到了前者——它压缩了人类在互联网上留下的所有文字,把人类的语言模式、知识结构、思维习惯都编码进了模型的参数里。但这只是"下载了互联网",而不是"下载了人类"。真正的人类智能,还包括感知、行动、在物理世界中生存的能力——这些,语言模型永远无法从文字中学到。

这也是他离开大厂、和杨立昆共同创立 AMI Labs 的根本原因。

AMI Labs 有6位联合创始人,融资规模约3亿美元。他们选择在纽约而非硅谷创业,这个选择本身就是一种宣言。

谢赛宁说:

"硅谷现在被催眠了。所有人都在做同一件事,都在 Scaling,都在相信同一条路。被催眠的人总会醒来,但醒来的时候可能已经很晚了。"

他们选择做 underdog,选择走一条更难、但他们相信更正确的路。纽约不是硅谷,没有那种集体催眠的氛围,反而给了他们一种清醒的距离感。

这让我想起一个规律:真正的颠覆性创新,往往不是从中心发生的,而是从边缘发生的。 因为中心太拥挤,太嘈杂,太容易被主流叙事裹挟。边缘反而有空间去想那些"不合时宜"的问题。


七、自大的人类,与"42"

访谈接近尾声,谢赛宁谈到了一个更宏大的命题:人类在宇宙中的位置。

他提到寒武纪大爆发——大约5亿年前,生物突然进化出了眼睛。视觉的出现,让物种能够感知更复杂的环境,做出更复杂的判断,物种多样性因此爆炸式增长。他认为,AI 视觉能力的突破,可能正在触发一次类似的"认知寒武纪"——当机器真正能够"看见"并理解这个世界,整个智能的版图将会被重写。

但他同时也发出了一个警告:

"人类太自大了。我们总以为自己是宇宙的中心,总以为智能只有一种形式,总以为我们现在走的这条路就是唯一正确的路。但也许,我们只是这个宇宙里一个非常局部的、非常短暂的存在。"

这种谦逊,不是虚伪的谦虚,而是真正的科学精神——承认自己的无知,才能真正去探索未知。

最后,是公司名字"42"的来源。

来自道格拉斯·亚当斯的科幻小说《银河系漫游指南》:一台名为"深思"的超级计算机,被问到"宇宙、生命与万物的终极答案是什么",经过750万年的计算,它给出的答案是——42

但没有人知道,那个问题究竟是什么

谢赛宁说:

"我们不知道问题是什么,但我们在寻找答案。这就是我们在做的事情。"

这句话,是整个7小时访谈最好的注脚。AI 研究的本质,不是给出答案,而是找到那个真正值得被问的问题。而 AMI Labs,就是他们寻找那个问题的方式。


💬 值得反复咀嚼的金句

访谈中有太多值得记录的话,以下是我认为最有分量的几句,每一句都值得单独思考:

"年龄大了之后,拥有了不被人喜欢的勇气。"
这是一种成熟。年轻时我们太在意别人的眼光,太想被认可,反而失去了说真话的能力。

"这个世界总不让我做我想做的事情,但我偏偏要做。"
这不是叛逆,而是一种对自我判断的信任。

"重要的是跟谁做什么事,不是在哪里。"
平台不重要,人和问题才重要。

"如果一个人把绩点评分作为自己的至高追求,那么他就是这个政策的牺牲品。"
这句话不只适用于学生,也适用于每一个用 KPI 来定义自己价值的人。

"你不做这件事,这件事在世界上永远不会发生。"
这是一种责任感,也是一种对自己独特性的认可。

"应无所住而生其心。"
不执着于方法,但要有清晰的问题驱动你。

"LLM 只是人的一个反射,它是你自己的镜子。"
这是对 AI 本质局限最精准的一句描述。

"硅谷被催眠了。被催眠的人总会醒来,但醒来的时候可能已经很晚了。"
这句话,不只是在说硅谷,也是在说每一个跟风的人。

"我们不知道问题是什么,但我们在寻找答案。"
这是科学精神,也是人生哲学。


🧭 对一人公司的启发

看完这个访谈,我反复在想:谢赛宁的故事,和一人公司的逻辑,其实是同构的。

他不是在一个大组织里按部就班地往上爬,而是一个人带着一个问题,在不同的地方、不同的人之间流浪、碰撞、生长。这和一人公司的本质何其相似——你没有组织的庇护,没有团队的分工,有的只是你自己对某个问题的判断,和把这个判断变成现实的行动力。

这里有几条我认为对一人公司最有价值的启发:

1. 找到你的"隐藏主线",而不是追热点

谢赛宁的研究看起来很散,但其实一直在问同一个问题。一人公司也是如此——你不可能什么都做,你必须找到那条只属于你的主线。不是市场最热的方向,不是别人都在做的事,而是那个你愿意用五年、十年去深挖的问题。

主线找到了,你才有定力在别人都在跟风的时候,继续做自己的事。

2. "先斩后奏"的行动力,是一人公司的核心竞争力

他大三实习,不等批准,先发邮件,拿到 offer 再汇报。这种行动力,在大公司里可能是"不合规矩",但在一人公司里,它是生存的基础

一人公司没有委员会,没有审批流程,你的速度就是你的护城河。想到就做,做了再说,错了再改——这是一人公司对抗大公司最重要的武器之一。

3. 关系比平台重要:跟谁做,比在哪里做更关键

他跟着导师从 UCLA 转到 UCSD,没有犹豫。因为他知道,真正重要的是人,不是学校的名字。

对一人公司来说,这一点尤其关键。你的客户、合作伙伴、同行圈子,才是你真正的"平台"。选择和谁合作,比选择在哪个平台上发布内容,重要得多。一个真正认可你价值的客户,抵得上一百个泛泛的流量。

4. 做 underdog,是一种战略选择,不是一种委屈

谢赛宁和杨立昆选择在纽约创业,拒绝硅谷的集体催眠。这不是因为他们去不了硅谷,而是因为他们清楚地知道:在主流的喧嚣里,你很难听见自己内心的声音。

一人公司天然就是 underdog。你没有大公司的品牌背书,没有融资的光环,没有团队的规模感。但这恰恰是你的优势——你可以做大公司不屑于做的小事,可以服务大公司忽视的小众需求,可以在别人都在争夺同一块蛋糕的时候,悄悄去烤一块不一样的。

5. 你的"42"是什么?

这是我看完整个访谈,最想问自己的问题。

谢赛宁用一生在寻找那个"真正值得被问的问题"。对一人公司来说,这个问题同样存在:你做这件事,究竟是为了什么?是为了赚钱?为了自由?为了证明什么?还是因为这件事本身,就是你觉得这个世界需要有人去做的?

答案没有对错。但你必须有答案。因为在一人公司最难熬的那些时刻——没有客户、没有反馈、没有人相信你——支撑你继续的,不是方法论,不是工具,而是那个让你"偏偏要做"的理由。

找到你的"42"。不是那个答案,而是那个问题。


📌 结尾

文章开头,我说自己每天面对的问题是:在一个被大厂和资本裹挟的时代,一个独立的技术人,应该怎样找到自己的方向?

看完谢赛宁的故事,我想我找到了一个不算答案的答案:

不是找到方向,而是找到那个让你"偏偏要做"的问题。

他不是最聪明的那个人,不是最顺利的那个人,但他是那个一直在问同一个问题的人。从交大书房里翻书的少年,到纽约布鲁克林谈世界模型的研究者,变的是身份和舞台,不变的是那份对"表征"、对"智能本质"的执念。

作为一人公司的实践者,我深知:独立,从来不是一种姿态,而是一种对自己诚实的选择。 你必须知道自己真正相信什么,才能在所有人都在跟风的时候,做出不一样的判断。

谢赛宁两次拒绝 Ilya,不是因为他不知道那意味着什么,而是因为他知道:如果你不做你真正相信的事,那你做的一切,都只是在帮别人实现他们的答案。

而我们,都需要找到自己的"42"。

不是那个答案,而是那个让你愿意用一生去追问的问题。


本文整理自 B站「张小珺商业访谈录」,原视频时长约7小时,强烈建议有时间的朋友去看完整版。

— dtsola|IT解决方案架构师 | 一人公司实践者


如果这篇文章对你有帮助,欢迎点赞、收藏、转发。也欢迎在评论区分享你的经验,我们一起交流学习!


我是 dtsola【IT解决方案架构师 | 一人公司实践者】 ;专注AI创业、商业、技术、心理学、哲学内容分享。

提供服务:AI项目咨询 | 技术解决方案 | IT项目实施 | 企业技术顾问

博客:https://www.dtsola.com

公众号&VX:dtsola

需提供服务,加微信 dtsola,备注:IT咨询,并说明来意。


#独立开发者 #AI编程 #个人开发者 #一人公司 #程序员 #软件开发者 #创业者 #数字游民 #AI创业 #人工智能


Work Less, Earn More, Enjoy Life.