Meta杨立昆重磅发布:新一代世界模型V-JEPA 2引领AI物理理解新纪元

   发布时间:2025-06-17 01:42 作者:冯璃月

meta近日震撼发布了其最新的开源世界模型V-JEPA 2,这一突破性进展标志着AI在物理世界的理解与预测能力迈上了新台阶。据悉,该模型显著提升了AI agents的物理推理能力,使其更加智能且高效。

meta的副总裁兼首席AI科学家杨立昆在官方视频中透露,世界模型的引入让AI无需再经过数百万次的训练即可掌握新技能。这一模型直接揭示了世界的运作机制,从而极大地提高了学习效率。例如,AI现在能预测人类舀出一勺东西后将其放入另一个容器的动作,甚至能理解并拆解复杂的跳水动作。

据meta的测试数据显示,V-JEPA 2在测试任务中的规划用时仅为英伟达Cosmos模型的三十分之一,同时成功率更高。这一显著成果得益于V-JEPA 2使用超过一百多万小时的视频进行自监督学习训练。通过这一方式,模型学习到了物理世界中的重要规律,包括人类与物体的互动方式、物体的运动方式以及物体间的相互作用。

meta强调,物理推理能力对于构建在现实世界中运作的AI agents至关重要,是实现高级机器智能(AMI)的关键。通过世界模型,AI agents能够“三思而后行”,即在实际行动之前进行充分的理解和规划。例如,在机械臂上部署V-JEPA 2模型,使其能够执行物体操作类任务,如触碰、抓取和摆放物体,而无需大量机器人数据或针对性训练。

meta还发布了三个新的基准测试,旨在评估现有模型通过视频学习和推理物理世界的能力。这些基准测试包括IntPhys 2、Shortcut-aware Video-QA Benchmark和CausalVQA,它们分别测试了模型在复杂合成环境中的物理理解能力、基于最小视频对的物理理解视频问答能力以及物理基础因果推理能力。

此次V-JEPA 2的发布正值meta在AI领域大动作频频之际。就在前一天,meta宣布将成立新的AI实验室,并豪掷148亿美元收购Scale AI 49%的股份。这一系列举措无疑彰显了meta在AI领域的雄心壮志。通过世界模型的引入和基准测试的发布,meta正努力推动AI从数字世界加速走向物理世界,开启AI技术竞争的新篇章。

 
 
更多>同类内容
全站最新
热门内容
本栏最新
 
智快科技微信账号
微信群

微信扫一扫
加微信拉群
电动汽车群
科技数码群