新智元报道

  编辑:定慧

硅谷最新「神仙打架」来了:一个是预言 40 年全准的 AI 教父,一个是嘴炮满级、逮谁怼谁的深度学习头号黑粉。也许 LeCun 离开 Meta 仅仅是未来硅谷 AI 风起云涌的一次预演。

  如果要评选近期 AI 圈的「超级地震」,Yann LeCun 被曝将离开 Meta 绝对算得上大地震。

作为图灵奖得主,LLM 的公开反对者,世界模型的苦行僧,开源模型的守护者,X的全职博主。。。

  Yann LeCun 身上有太多的标签。

  最近外媒 WSJ 给 LeCun 写了一篇有点「歌颂功德」味道的文章,声称「他一直正确了 40 年」。

作为一名和 Hinton 齐名,乃至共事过的 AI 老兵,LeCun 的地位也当得起这些夸赞。

  但这篇文章,和 LeCun 本人却遭到了马库斯的极度不认可。

  马库斯的观点是我们都被他骗了十年,不要将他神化!甚至表示:

  Yann LeCun 赖以成名的 CNN 卷积神经网络成果晚于 1988 年张伟等人发表的文章。

  虽然 LeCun 在卷积神经网络的发展过程中发挥了作用。但他既非其发明者,也非首个将反向传播算法应用于训练网络权重的研究者(尽管许多人误以为是如此)。

  如果说 Yann LeCun 是深度学习阵营内部的「反对派」,他反对 LLM,但坚持深度学习和最新的世界模型。

  那么Gary Marcus(加里·马库斯)就是站在深度学习大门外的「敲钟人」和「职业批判家」。

  作为一名认知科学家和心理学家,他在 AI 圈的角色非常独特且富有争议。

  马库斯可以算得上是深度学习的「头号黑粉」

他坚持认为「深度学习撞墙了」(Deep Learning is hitting a wall)!

  早在 2018 年,他就撰文指出深度学习存在数据效率低、缺乏迁移能力、无法理解因果关系等致命弱点。

  对 LLM 的态度,他比 LeCun 更加激进。

LeCun 认为 LLM 只是路线不对,而 Marcus 认为目前的 LLM 本质上没有真正的理解力,无法解决幻觉问题,且难以通向 AGI。

  与 LeCun 提倡的「世界模型」(依然基于神经网络)不同,马库斯主张神经符号主义。

他认为 AI 必须结合两者的优点:神经网络(用于学习和感知)+符号逻辑(用于推理和常识)。

他常举例说,人类不需要读完互联网所有的书才知道「把手伸进火里会烫」,这是因为我们有先验知识和逻辑推理,而纯深度学习缺乏这种结构。

  两人经常互相讽刺。

  LeCun 甚至一度在社交媒体上拉黑或无视马库斯,称他为「只会抱怨不会写代码的心理学家」。

  反方:包装成的「孤独的天才」

  马库斯这次依然是怒喷 Yann LeCun,《对 Yann LeCun 的虚假造神》

  中心思想就一句话:什么孤独天才?全是公关包装!他的那些「原创」,全是剽窃别人的!

  所谓的「卷积之父」,其实是抢功劳?

  Yann LeCun 最引以为傲的成就,莫过于卷积神经网络(CNN

  这也是他拿图灵奖的资本。

  但在 Marcus 眼里,这简直是「贪天之功」。

  Marcus 直接甩出证据:

早在 1979 年,日本学者福岛邦彦就做出了基础工作。

1988 年,中国学者张伟等人就把反向传播算法用到了 CNN 上。

  其实,最早把张伟这位大神「挖」出来打脸 LeCun 的,不是 Gary Marcus,而是著名的 AI 怨妇/LSTM 之父——Jürgen Schmidhuber。

Schmidhuber 多年来一直致力于证明「深度学习现在的巨头们都抄袭了以前的成果」。

以下是 Schmidhuber 专门抨击 2018 年图灵奖颁发给「深度学习三巨头」(LeCun, Hinton, Bengio)的文章。

  文章链接:https://people.idsia.ch/~juergen/critique-turing-award-bengio-hinton-lecun.html

Schmidhuber 专门撰写的关于 CNN 发明权的文章:

  Who Invented Convolutional Neural Networks? (谁发明了卷积神经网络?)

文章链接:https://people.idsia.ch/~juergen/who-invented-convolutional-neural-networks.html

  Schmidhuber 专门好用⭐️标注了:

1988 年 Wei Zhang(在日本工作的中国研究员)及其同事拥有了第一个通过反向传播训练的「现代」二维 CNN,并将其应用于字符识别。

  计算成本大约是现在的 1000 万倍。

1989 年 4 月:张伟等人还首次提交了关于「现代」反向传播训练 CNN(并应用于字符识别)的期刊投稿。

1989 年 7 月:贝尔实验室的 Yann LeCun 等人在继 Zhang 等人之后,发表了关于反向传播训练 CNN 用于字符识别(邮政编码)的第二篇期刊投稿。

  他特意把时间精确到月份,就是为了证明:张伟(1988 年/1989 年 4 月)在时间线上早于 Yann LeCun(1989 年 7 月)。

  Yann LeCun 呢?

他只是在第二年发了英文论文,不仅没提张伟,连其他前辈也极少引用。

基础性工作由福岛邦彦在 1979-1980 年完成;张伟等人(1988 年)早于 LeCun 将反向传播算法应用于卷积神经网络,这项鲜为人知的研究于 1988 年以日文发表(附英文摘要)。

  LeCun 的幸运之处在于次年以英文在更知名的平台发表了论文,并提出了提升网络性能的重要技巧,但他的研究并非首创。LeCun 很少提及他的前辈学者。

Marcus 讽刺道:「他不是发明者,他只是擅长把别人的成果贴上自己的标签。」

  以前骂我「疯子」,现在装「先知」?

最近,Yann LeCun 因为疯狂 Diss 大语言模型(LLM),说它「不如猫」、「没前途」,被捧为反主流的英雄。

  Gary Marcus 看着这些新闻,估计牙都咬碎了。

  为什么?

  因为 Marcus 自己才是那个最早质疑 LLM 的人!

  早在 2019 年,Marcus 就公开说 GPT 不行。

当时 Yann LeCun 在干嘛?他在网上嘲讽 Marcus 是「顽固派」,还在 Facebook 上带头网暴他!

直到 ChatGPT 出来,把 Meta 自家的模型按在地上摩擦,Yann LeCun 才突然改口,变成了「反 LLM 斗士」。

  Marcus 怒极反笑:「这就叫 40 年一贯正确?这叫见风使舵!」

证据如下,2022 年 11 月,LeCun 仍在高声宣扬(其公司的)LLMs 是「了不起的成果」:

  (插一句,看大佬们撕逼真爽,有理有据)

  「世界模型」?那是 50 年代的旧古董!

  Yann LeCun 最近要离职创业,搞那个听起来高大上的「世界模型」。

  WSJ 把它吹成了 AI 的未来救星。

Marcus 冷冷一笑:这也叫创新?

1950 年代,赫伯特·西蒙就提过了。

1990 年代,施密德·胡伯(另一位被遗忘的大神)早就以此为核心了。

就连 Marcus 自己,也在 2019 年的书里呼吁过。

当时 Yann LeCun 对这些理论爱答不理

  现在?他把这些旧概念捡起来,换个包装,又成了自己的「独家发明」。

  Marcus 引用了「思想剽窃」的官方定义,指着 Yann LeCun 的鼻子骂:挪用他人观点、不给原作者署名、假装自己是原创。

  这事儿,你干了不是一次两次了!

  Marcus 最后总结道:Yann LeCun 确实有贡献,这不可否认。

  但他和 Meta 联手,利用媒体霸权,把自己塑造成唯一的英雄,而系统性地抹杀、无视了无数前辈和同行的心血。

  包括中国的张伟、日本的福岛、还有被他骂过的 Marcus 自己。

  「这哪里是孤独的天才?这分明是吃相难看的掠夺者。」

  正方:正确了 40 年的 AI 先驱

其实 WSJ 的观点很简单。用一个标题总结的话就是:

  硅谷大地震!AI 教父与扎克伯格「决裂」?

  40 年预言全中,这次他又要单挑全世界!

  说白了,有点相当于一篇「软文」,给 LeCun 的新公司来造势的。

  「众人皆醉我独醒。」

  这大概是 Yann LeCun 此刻最真实的内心写照。

  他是图灵奖得主,是现代人工智能的奠基人之一,是 Meta(Facebook)首席 AI 科学家。

但在自家公司里,他却成了一个「格格不入的局外人」。

  这位 65 岁的AI教父,正密谋「出走」Meta,另起炉灶!

  理由只有一个:他觉得现在的AI路子,全走歪了!

  这一局,只有他敢说「不」

  现在的硅谷,什么最火?毫无疑问,大语言模型(LLM)

  扎克伯格为了追赶 ChatGPT 和谷歌,正像疯了一样狂砸数千亿美元,组建了一支顶尖大军,只为打造那个传说中的「超级智能」。

  但在 Yann LeCun 眼里,这简直是场笑话。

他不止一次在公开场合,指着那些价值连城的 LLM 说:

  「这玩意儿就是个死胡同!」「现在的 AI 模型,智商还不如一只猫!」

  你想想,老板在疯狂烧钱搞基建,首席科学家却在旁边泼冷水说「此路不通」。这画面,太窒息了。

更绝的是,他在麻省理工学院的讲台上,直接放狠话:「未来 3 到 5 年,现在的 LLM 都会被淘汰!谁脑子正常还会用这种东西?」

  据悉,他正准备创立一家新公司,专攻他心中的终极答案——「世界模型」

不像 LLM 只会死记硬背海量文本,他的「世界模型」像人类婴儿一样,通过观察视觉信息来理解这个世界。

  从「被嫌弃」到「封神」,再到「局外人」

  Yann LeCun 这辈子,似乎总是在逆行

  80 年代,他在读博。那时没人看好机器学习,他连个导师都找不到。

  90 年代,他在贝尔实验室。他搞出了手写识别技术,银行都在用,可那时候 AI 还是个冷门词。

  直到 2013 年,扎克伯格为了抢占未来,三顾茅庐,亲自请他出山,掌管 Facebook 的 AI 大印。

  2018 年,他拿下了计算机界的诺贝尔奖——图灵奖

  那时的他,穿着黑色雷朋眼镜,带着淡淡的法国口音,是 Meta 当之无愧的「门面担当」。

  然而,蜜月期结束了。

当 ChatGPT 横空出世,当所有的聚光灯都打向了 OpenAI,Meta 慌了。

  扎克伯格需要的是即战力,是能马上变现的产品,而不是 Yann LeCun 那些「仰望星空」的理论。

  于是,最扎心的一幕发生了。

  28 岁的新老板,65 岁的老教父。

  今年夏天,Meta 搞了一场大清洗。

  扎克伯格提拔了一位年仅 28 岁的天才少将——Alexandr Wang,担任 Meta 新的首席 AI 官。

  是的,你没看错。

  这位 28 岁的年轻人,成了 65 岁图灵奖得主 Yann LeCun 的顶头上司。

  曾经那个充满理想主义色彩、只谈未来不谈 KPI 的 FAIR 实验室(基础 AI 研究),如今面临裁员、资源缩减。

取而代之的,是一群拿着数百万年薪、只为快速出产品的新贵。

  虽然扎克伯格还在社交媒体上维持体面:「Yann 的职位没变,他还是首席科学家!」

  Yann LeCun 也礼貌回复:「期待合作。」

  但明眼人都看得出来:属于 Yann LeCun 的 Meta 时代,正在落幕。

  最后的倔强

  Yann LeCun 老了吗?

  也许。

  但他认输了吗?绝不。

即使被边缘化,即使被视为「老顽固」,他依然满世界飞,在各种大会上向年轻的研究者喊话:「如果你是AI博士生,千万!千万不要去搞大语言模型!」

  甚至有传言,他正在招兵买马,要把老部下们拉走,去证明「世界模型」才是真理。

  他的老友评价他:「固执,但是那种好的固执。」

  他自己在网站上写道:「我是科学家,无神论者,左派,大学教授,还是个法国人。我是右翼鄙视的一切。」

  你看,这就叫硬骨头

  究竟是扎克伯格用金钱堆出了大力奇迹?还是这位「预言全中」的老教父,再一次狠狠打脸全世界?

  这场硅谷年度大戏,才刚刚开始。

  最后,马库斯还引用了一些其他人的观点来佐证他自己的观点。

  有人说 Marcus 是嫉妒,有人说这是迟来的正义。

  但在名利场上,或许从来就没有绝对的白莲花。

  这场神仙打架,你站谁?

  参考资料:

  https://www.wsj.com/tech/ai/yann-lecun-ai-meta-0058b13c

  https://garymarcus.substack.com/p/the-false-glorification-of-yann-lecun