Yann LeCun提出自动机器智能，有望超越GPT-4

Tags: 人工智能自回归作者：网络更新：2023-03-29

最近，图灵奖得主 Yann LeCun 给一场辩论做了个特别的开场。LeCun认为，「从现在起 5 年内，没有哪个头脑正常的人会使用自回归模型。」。而他口中的自回归，正是当前爆红的 GPT 家族模型所依赖的学习范式。

Yann LeCun 延续了他一贯的犀利风格，直言不讳地指出「Machine Learning sucks!」「Auto-Regressive Generative Models Suck!」最后话题自然是回到「世界模型」。

LeCun 一直在强调，与人和动物相比，当前的这些大型语言模型在学习方面是非常低效的：一个从没有开过车的青少年可以在 20 小时之内学会驾驶，但最好的自动驾驶系统却需要数百万或数十亿的标记数据，或在虚拟环境中进行数百万次强化学习试验。即使费这么大力，它们也无法获得像人类一样可靠的驾驶能力。

在 LeCun 看来，目前各种大模型是基于自回归算法的，而这类模型是没有前途的（Auto-Regressive LLMs are doomed）。因为它们虽然表现惊人，但很多问题难以解决，包括事实错误、逻辑错误、前后矛盾、推理有限、容易生成有害内容等。重要的是，这类模型并不了解这个世界底层的事实（underlying reality）。

LeCun 提出了构建「世界」模型的想法，并在一篇题为《A path towards autonomous machine intelligence》的论文中进行了详细阐述。

具体来说，他想要构建一个能够进行推理和规划的认知架构。这个架构由 6 个独立的模块组成：

配置器（Configurator）模块；
感知模块（Perception module）；
世界模型（World model）；
成本模块（Cost module）；
actor 模块；
短期记忆模块（Short-term memory module）。

Yann LeCun 还在 PPT 中阐述了之前论文里提到的一些细节。

概率模型在连续域中是难以实现的，而生成式模型必须预测世界的每一个细节。

基于此，LeCun 给出了一种解决方案：联合嵌入预测架构（Joint-Embedding Predictive Architecture，JEPA）。

JEPA 不是生成式的，因为它不能轻易地用于从 x 预测 y。它仅捕获 x 和 y 之间的依赖关系，而不显式生成 y 的预测。

通用 JEPA。

如上图所示，在这种架构中，x 代表过去和当前观察到的，y 代表未来，a 代表 action，z 代表未知的潜在变量，D（）代表预测成本，C（）代表替代成本。JEPA 从代表过去和现在的 S_x 的表征中预测一个代表未来的 S_y 的表征。

生成式架构会预测 y 的所有的细节，包括不相关的；而 JEPA 会预测 y 的抽象表征。

在这种情况下，LeCun 认为有五种思路是需要「彻底抛弃」的：

放弃生成式模型，支持联合嵌入架构；
放弃自回归式生成；
放弃概率模型，支持能量模型；
放弃对比式方法，支持正则化方法；
放弃强化学习，支持模型预测控制。

他的建议是，只有在计划不能产生预测结果时才使用 RL，以调整世界模型或 critic。

迈向自主式 AI 系统的步骤都有哪些？LeCun 也给出了自己的想法：

1、自监督学习

学习世界的表征
学习世界的预测模型

2、处理预测中的不确定性

联合嵌入的预测架构
能量模型框架

3、从观察中学习世界模型

像动物和人类婴儿一样？

4、推理和规划

与基于梯度的学习兼容
没有符号，没有逻辑→向量和连续函数

原始出处：

https://openreview.net/pdf?id=BZ5a1r-kVsf

https://mp.weixin.qq.com/s/m943KNGUzFqu62lAlyl5-A s机器之心

https://www.shaped.ai/blog/yann-lecun-a-path-towards-autonomous-machine-intelligence

来源：网络

版权声明：
本网站所有注明“来源：梅斯医学”或“来源：MedSci原创”的文字、图片和音视频资料，版权均属于梅斯医学所有，非经授权，任何媒体、网站或个人不得转载，授权转载时须注明“来源：梅斯医学”。本网所有转载文章系出于传递更多信息之目的，且明确注明来源和作者，不希望被转载的媒体或个人可与我们联系，我们将立即进行删除处理。同时转载内容不代表本站立场。
在此留言

小提示：本篇资讯需要登录阅读，点击跳转登录

Yann LeCun提出自动机器智能，有望超越GPT-4

相关推荐