昆仑万维近日震撼宣布,其倾力打造的Matrix-Game大模型(规模超过170亿参数)已正式向公众开放源代码。这一大模型,作为Matrix-Zero世界模型的重要组成部分,专注于可交互视频生成领域。
据昆仑万维介绍,Matrix-Game标志着Matrix系列在交互式世界生成领域的重大突破,同时也是业界首个对外公开的、参数规模超过100亿的空间智能大模型。该模型专为游戏世界的建模设计,致力于在开放环境中实现高质量内容的生成与精准控制。
Matrix-Game的核心竞争力体现在三大方面:首先是Matrix-Game-MC数据集,这是一个由昆仑万维自主构建的大规模交互世界数据集。该数据集不仅包含了海量的无标签Minecraft游戏视频,还涵盖了带有精细动作注释的Minecraft与Unreal可控视频数据,这些数据为复杂环境动态与交互模式的高效建模与学习提供了有力支撑。
其次是Matrix-Game主模型,这一模型基于先进的扩散模型技术开发,能够根据用户的输入(如键盘指令、鼠标移动等)生成连贯且可控的互动视频。这些视频在视觉质量、时序一致性与物理合理性方面均表现出色,为用户带来了沉浸式的交互体验。
最后是GameWorld Score评测体系,昆仑万维提出了这一统一的游戏交互世界评估标准,从视觉质量、时序质量、动作可控性与物理规则理解四个维度对模型性能进行全面量化。这一评测体系的建立,填补了该领域缺乏系统性评测基准的空白。
在实际应用中,Matrix-Game展现出了强大的场景适应能力。它能够在Minecraft的各种场景中(如森林、沙滩、沙漠等)实现可控生成,支持角色的基础运动、复合运动以及视角变换等动态行为。例如,在沙漠场景中,用户只需通过键盘和鼠标输入控制指令,Matrix-Game就能生成对应的游戏世界视频,呈现出角色前后左右移动、跳跃、攻击等精彩瞬间。
Matrix-Game还支持自回归式的长视频生成,这在时间一致性与环境适应性方面均表现出卓越的性能。这一特性为开发沉浸式长时体验、创意内容生成以及游戏设计等领域提供了坚实的模型基础,预示着未来在交互式娱乐内容创作方面的无限可能。