京东探索研究院近日宣布,其自主研发的图像编辑模型JoyAI-Image-Edit正式面向全球开发者开源。这款模型突破了传统图像编辑技术的平面局限,首次将空间智能深度融入设计框架,使AI能够精准理解三维空间关系并实现复杂场景重塑,标志着图像处理技术从二维平面迈向三维空间的新纪元。
该模型通过构建空间位置感知、多视角一致性维护、相机参数解析等核心模块,实现了相机视角变换、物体空间位移、几何结构精准控制等技术创新。京东实验室测试数据显示,其在物体移动精度、空间连续性等关键指标上已达到国际领先水平,尤其在处理复杂遮挡关系和光影过渡时展现出显著优势。与传统模型相比,JoyAI-Image-Edit能够同时处理15类通用编辑任务,包括物体增删改、风格迁移、细节优化等高频创作需求。
模型三大核心功能构成其独特竞争力:视角变换功能支持通过自然语言指令调整相机偏航角、俯仰角和缩放比例,在保持场景几何结构完整的前提下生成新视角图像;空间漫游功能可模拟三维空间移动轨迹,自动生成逻辑连贯的多视角图像序列;物体空间关系操控功能则能在维持场景整体稳定性的同时,对指定物体进行位移、旋转或缩放操作,并自动优化遮挡关系和光影效果。
这项技术突破为多个行业带来革新可能。在电商领域,商家可通过自然语言指令快速生成多角度商品展示图;创意设计行业能利用空间漫游功能制作沉浸式场景预览;智能图像处理领域可实现更精准的3D模型重建;具身智能研发则获得关键的视觉感知底层支持。开发者现可自由获取模型推理代码,基于其开放架构开发各类商业应用。
技术团队透露,模型训练过程中构建了包含数百万空间标注数据的训练集,特别强化了对室内外场景的空间关系理解能力。其创新的空间坐标编码机制,使模型能够解析物体在三维空间中的绝对位置和相对关系,这项突破解决了开源社区长期存在的空间感知难题。随着模型开源,预计将推动AI图像技术在自动驾驶、机器人导航、虚拟现实等领域的快速落地应用。




















