人工智能并不“聪明”，那么人工智能的未来是什么？

“我们没有机器人能够像老鼠那样理解物理世界，”人工智能领域的领先人物颜李君说。他在Facebook母公司Meta工作了十年，担任首席AI科学家，但在2025年离开并创立了先进机器智能实验室（AMI Labs）。他的目标是让人工智能超越当前的系统，比如ChatGPT、Claude和Gemini。他说，这些系统有其用途，但永远无法应对现实世界中的复杂情况，比如让机器人做家务。“它们不会是通往人类水平或类人智能的道路，甚至不是类动物智能，因为它们无法处理现实世界的数据，根本不是为此而构建的。”他在法国领先的科技会议VivaTech的间隙告诉我。因此，总部位于巴黎的AMI Labs正在忙于开发一种基于ChatGPT及其竞争对手背后技术的新型人工智能。投资者认为它具有潜力。今年早些时候，AMI Labs宣布他们已筹集超过10亿美元（约合7.6亿英镑），投资者包括美国计算机芯片巨头Nvidia，以及管理亚马逊创始人杰夫·贝索斯个人财富的基金。这个所谓的种子基金轮，也就是初创公司募资的最早阶段，是欧洲此类融资中最大的一轮之一。颜李君表示，大型语言模型（LLMs）像ChatGPT在一些事情上非常出色，比如编码、数学问题和生成文本。但是他认为这些都是定义清晰且可预测的问题。“它们基本上只是积累知识……它们可以重复某些内容，你训练它们去重复，但它们并不是特别聪明。它们没有基本的理解。”他说，在现实世界中，任何行动都会有令人困惑的结果，这需要一种更灵活的人工智能。颜李君竖起一支笔。放手后会发生什么，他问？即使是一个小孩也会知道这根笔会倒下来。但没有人会费心去猜测笔可能会向哪个方向掉落，因为无法预测。然而，LLM可能会尝试基于训练数据中的统计模式生成一个关于笔下一个动作的单一预测。这个预测几乎肯定是错误的，因为该系统并未对该情况的物理现实进行推理——它只是在生成看似统计上合理的东西。颜李君说，他的公司正在开发的系统，称为联结嵌入预测架构（JEPA），可以处理像这样的难题。它创建真实世界的抽象，使其能够评估行动的结果。创建这些抽象涉及困难的数学，但本质上它们排除无用的信息，只留下对世界有用的图像。在笔的案例中，人工智能会知道没有必要去预测笔会向哪个方向掉落。人工智能行业中的许多人都同意颜李君的观点。英玛尔·波斯纳就是其中之一。他是牛津大学应用人工智能教授，主持其应用人工智能实验室。他也是亚马逊学者。“我的观点是，未来十年真的会是关于可以解释的系统……你需要能够回答的问题的模型：什么重要？什么导致了什么？如果我采取不同的行动，会发生什么？”波斯纳和他的10名研究人员团队已经在另一种人工智能上工作了四年，这种人工智能属于一个松散的类别，称为世界模型。虽然世界模型的概念存在了几十年，但这一工作的一个灵感来自于2018年大卫·哈和尤尔根·施密特胡伯发表的影响力论文。他们的洞察是，鉴于机器学习和计算能力的进步，人工智能可以纯粹通过对世界外观的“心理”模拟来学习如何做某事。自2018年以来，这一理念催生了大量关于世界模型的研究，包括谷歌的梦境世界模型。去年，一个梦境变体在视频游戏Minecraft中找到了如何收集钻石的方法，通过想象未来场景来帮助其决策。波斯纳希望他的团队正在开发的人工智能系统将是又一步的进展。他称之为“机械世界模型”，将以一种人工智能可以高效使用的方式构建知识。“你需要能够将知识划分和组织的系统，以便在重要时刻能够回忆、组合和修改。”波斯纳说。他补充道，很难说开发这些新模型需要多长时间。“如果你在2017年或2018年问任何人，何时能够有一个类似于ChatGPT的东西，他们会说：‘几十年，几十年的工作。’”原始版本的ChatGPT于2022年11月推出。其他世界模型的研究也由DeepMind（谷歌母公司的一部分）进行。