新智元报道

  编辑:倾倾

他被 12 所大学拒绝,签证差点作废。后又被 DeepMind 拒了三次,在亚马逊做着最不起眼的测试工作。十二年后,这个被世界反复拒绝的人,写出了改变 AI 格局的 PyTorch。

  在X上,流传着一个关于 PyTorch 创始人 Soumith Chintala 的故事。

  他出身普通,数学不好,被美国 12 所大学拒绝。靠着一张短期签证去美国,无学位、无资金、无计划。

那几年,他被 DeepMind 拒了三次,连签证都差点失效。

  可他没放弃。2017 年,他写出了 PyTorch。

  那个被主流嫌「没前途」的开源项目,一夜之间成了香饽饽。

人们才发现,这个影响全球 AI 走向的工具,竟出自那个被拒 12 次的「失败者」之手。

  反复被拒的十年

  Soumith 的起点很普通。

  他出生在印度海德拉巴,读一所二本的学校——VIT Vellore。

数学不好、履历普通,这在印度那种内卷到骨子里的教育体系里,意味着前路不太妙。

  但他还是想出国读研。那年他拿着 1420 分的 GRE,申请了美国 12 所大学,可全被拒了。

后来,Soumith Chintala 拿到一张J-1 签证去了美国,却没有明确的方向,也没钱继续念书。

  申请第二轮硕士时,又被拒到只剩南加州大学和 NYU。留学梦差点断在签证那一关,那时候几乎所有人都觉得他要放弃了。

  可他没有妥协。他选择从亚马逊开始,做一个最不起眼的测试工程师。

Soumith 被 DeepMind 拒了三次,甚至拖了好几个月才拿到豁免签证。

  直到后来,他加入 Facebook AI Research(FAIR)。

起初只是个 L4 级别的小工程师,但他在一次 ImageNet 任务中发现了数值与超参数的错误。

  所有高级工程师都拿 bug 没有办法,而他只用几行代码就解决了。

  所有人这才发现,这个平时沉默的同事竟然有这种本事。

  从那一刻起,命运的齿轮开始缓缓转动。

  没人看好,但偏偏他最争气

  最开始进 FAIR 那几年,Soumith 的生活一点都不风光。

  他没名气、没头衔、没资源。团队主流都在用 Torch7——这个看起来前途渺茫的框架。

管理层多次提议砍掉这个项目,理由很简单:没人用,也看不到收益。

  那时候他的团队里已经有两三个人,但压力还是很大。

  公司要转向 TensorFlow。一旦转型成真,他几年的心血可能付之一炬。

  有一次,在一间旧酒吧里崩溃大哭,对着朋友说:

也许这就是终点了。

  那是 2016 年。命运在他生命最灰暗的时刻,悄悄转了个弯。

  他和团队决定赌一把——重写 Torch7,用更灵活的架构和更友好的接口,让研究者更容易上手。

项目地址:https://github.com/torch/torch7

  那就是后来改变整个 AI 生态的PyTorch

  2017 年,PyTorch 正式开源。

没人想到,这个差点被砍掉的项目,一年之内被全球顶尖实验室采用,成为深度学习研究的主流工具。

  学界疯狂拥抱,论文数量爆炸式增长;社区自发贡献,生态迅速完善。

  Meta 内部原本质疑它的管理层,也不得不承认:这一次,他们错了。

从此,Soumith 不再是那个「被拒 12 次的普通人」。

  他成了整个 AI 社区最受尊敬的工程师之一,名字和 Yann LeCun 一起被写进了 PyTorch 的诞生史。

  但他自己却很平静:

  我没想过要创造什么划时代的工具,只是不想让自己那几年白费。

  从小众框架到 AI 信仰:PyTorch 改变了谁?

  PyTorch 诞生时,几乎没人看好它。

  那时候的深度学习世界,被谷歌的 TensorFlow 霸占。

几乎所有论文、课程、模型都写着:「Implemented in TensorFlow.」

  可几个月后,形势彻底翻转。研究者开始在论文里换上新的署名——「Implemented in PyTorch.」

到 2021 年,TensorFlow 在谷歌上的搜索量都高于 PyTorch。然而,现在 PyTorch 已经反超,搜索量几乎是 TensorFlow 的 1.8 倍。

  为什么?因为 PyTorch 把「灵活」和「直觉」带回了 AI。

它不像 TensorFlow 那样死板,PyTorch 能让研究者边写边改,实时调整实验模型。

  无数人第一次意识到:机器学习可以这么自由,像是创作。

  到了 2018 年,Facebook 官方博客宣布推PyTorch 1.0,让它既能支撑研究,也能支撑生产级别的部署。

  这是一个信号:PyTorch 不再只是开源社区的玩具,而是 AI 工业的地基。

  之后的几年,产业结构变化肉眼可见。

在 NeurIPS、ICML、CVPR 等顶级会议上,超过七成的论文选择 PyTorch 作为实现框架;OpenAI、DeepMind、Anthropic 等公司都在使用或基于它构建研究工具。

Hugging Face 上的模型数量对比。可以看到,PyTorch 经成为 AI 研究者最常用的框架,而 TensorFlow 的份额正在快速缩小。

  而社区生态更是从几十人,扩展到全球数十万开发者。

PyTorch 从学术实验室走进工业界,从开源社区渗透到课堂、课程和科研机构。

  许多 AI 初创公司的第一个原型,都是在 PyTorch 上完成的。

  而 Soumith 自己,也被推到了舞台中央——从那个被拒 12 次的学生,变成 Meta 的副总裁。

他没有成为下一个马斯克,却成了那个「让成千上万人能造出下一个马斯克」的人。

  他改变了 AI,也改写了「失败」的定义

Soumith 后来成了 Meta 的副总裁,手握全球最主流的 AI 框架,开源社区里无数人以他为榜样。

  可他始终不是那种典型的「硅谷成功学」主角。

  他话不多,不发鸡汤,也不热衷讲「如何逆袭」。更多时候,他只是安静地写代码、审 PR、和社区开发者聊天。

他清楚自己来自哪里——一个被拒 12 次的学生,一个在签证大厅里焦虑等待的人。

  他懂得技术的意义:不只是效率,更是给普通人留的一个出口。

  如今,PyTorch 已被全球数百万人使用,几乎所有顶级 AI 模型的底层框架都离不开它。

OpenAI 的 GPT 系列、Stability 的生成模型、Anthropic 的 Claude,都在不同阶段依赖 PyTorch 的生态。

  那些站在聚光灯下的产品背后,都藏着他当年写下的一行行匿名代码。

他从未忘记那句话:

  我不是最聪明的人,只是那个还在坚持的人。

  这句话,后来成了无数开发者桌面上的座右铭。

  Soumith 的故事没有逆袭的爽点,只有漫长的打磨。他没有在被拒绝时怨恨世界,也没在成功后宣扬奇迹。

也许正因为如此,PyTorch 才能成为那个「所有人都能用、所有人都能改」的框架。

  因为它的灵魂,从一开始就属于那些「还没被看见」的人。

  参考资料:

https://ifstudies.org/blog/counterfeit-connections-the-rise-of-ai-romantic-companions-

https://www.wired.com/story/ai-relationships-are-on-the-rise-a-divorce-boom-could-be-next/