梅斯医学MedSci APP
医路相伴,成就大医

Yann LeCun提出自动机器智能,有望超越GPT-4

Tags: 人工智能   自回归      作者:网络 更新:2023-03-29

最近,图灵奖得主 Yann LeCun 给一场辩论做了个特别的开场。LeCun认为,「从现在起 5 年内,没有哪个头脑正常的人会使用自回归模型。」。而他口中的自回归,正是当前爆红的 GPT 家族模型所依赖的学习范式。

Yann LeCun 延续了他一贯的犀利风格,直言不讳地指出「Machine Learning sucks!」「Auto-Regressive Generative Models Suck!」最后话题自然是回到「世界模型」。

LeCun 一直在强调,与人和动物相比,当前的这些大型语言模型在学习方面是非常低效的:一个从没有开过车的青少年可以在 20 小时之内学会驾驶,但最好的自动驾驶系统却需要数百万或数十亿的标记数据,或在虚拟环境中进行数百万次强化学习试验。即使费这么大力,它们也无法获得像人类一样可靠的驾驶能力。

在 LeCun 看来,目前各种大模型是基于自回归算法的,而这类模型是没有前途的(Auto-Regressive LLMs are doomed)。因为它们虽然表现惊人,但很多问题难以解决,包括事实错误、逻辑错误、前后矛盾、推理有限、容易生成有害内容等。重要的是,这类模型并不了解这个世界底层的事实(underlying reality)。

图片

LeCun 提出了构建「世界」模型的想法,并在一篇题为《A path towards autonomous machine intelligence》的论文中进行了详细阐述。

具体来说,他想要构建一个能够进行推理和规划的认知架构。这个架构由 6 个独立的模块组成:

图片

 

Yann LeCun 还在 PPT 中阐述了之前论文里提到的一些细节。

图片

 

图片

 

图片

概率模型在连续域中是难以实现的,而生成式模型必须预测世界的每一个细节。

基于此,LeCun 给出了一种解决方案:联合嵌入预测架构(Joint-Embedding Predictive Architecture,JEPA)。

JEPA 不是生成式的,因为它不能轻易地用于从 x 预测 y。它仅捕获 x 和 y 之间的依赖关系,而不显式生成 y 的预测。

图片

 

通用 JEPA。

 如上图所示,在这种架构中,x 代表过去和当前观察到的,y 代表未来,a 代表 action,z 代表未知的潜在变量,D()代表预测成本,C()代表替代成本。JEPA 从代表过去和现在的 S_x 的表征中预测一个代表未来的 S_y 的表征。

图片

 

生成式架构会预测 y 的所有的细节,包括不相关的;而 JEPA 会预测 y 的抽象表征。

图片

 

 

图片

 

 

图片

在这种情况下,LeCun 认为有五种思路是需要「彻底抛弃」的:

他的建议是,只有在计划不能产生预测结果时才使用 RL,以调整世界模型或 critic。

图片

 

 

迈向自主式 AI 系统的步骤都有哪些?LeCun 也给出了自己的想法:

 

1、自监督学习

 

 

2、处理预测中的不确定性

 

 

3、从观察中学习世界模型

 

 

4、推理和规划

 

原始出处:

https://openreview.net/pdf?id=BZ5a1r-kVsf

https://mp.weixin.qq.com/s/m943KNGUzFqu62lAlyl5-A s机器之心

https://www.shaped.ai/blog/yann-lecun-a-path-towards-autonomous-machine-intelligence

来源:网络
版权声明:
本网站所有注明“来源:梅斯医学”或“来源:MedSci原创”的文字、图片和音视频资料,版权均属于梅斯医学所有,非经授权,任何媒体、网站或个人不得转载,授权转载时须注明“来源:梅斯医学”。本网所有转载文章系出于传递更多信息之目的,且明确注明来源和作者,不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。同时转载内容不代表本站立场。
在此留言
小提示:本篇资讯需要登录阅读,点击跳转登录

相关推荐

移动应用
medsci.cn © 2020