京东开源JoyAI-Image-Edit模型：突破空间编辑难题，赋能多元应用场景-行业-智快网

京东开源JoyAI-Image-Edit模型：突破空间编辑难题，赋能多元应用场景

发布时间：2026-04-10 12:07 来源：快讯作者：顾雨柔

京东探索研究院近日宣布，其自主研发的图像编辑模型JoyAI-Image-Edit正式面向全球开发者开源。这款模型突破了传统图像编辑技术的平面局限，首次将空间智能深度融入设计框架，使AI能够精准理解三维空间关系并实现复杂场景重塑，标志着图像处理技术从二维平面迈向三维空间的新纪元。

该模型通过构建空间位置感知、多视角一致性维护、相机参数解析等核心模块，实现了相机视角变换、物体空间位移、几何结构精准控制等技术创新。京东实验室测试数据显示，其在物体移动精度、空间连续性等关键指标上已达到国际领先水平，尤其在处理复杂遮挡关系和光影过渡时展现出显著优势。与传统模型相比，JoyAI-Image-Edit能够同时处理15类通用编辑任务，包括物体增删改、风格迁移、细节优化等高频创作需求。

模型三大核心功能构成其独特竞争力：视角变换功能支持通过自然语言指令调整相机偏航角、俯仰角和缩放比例，在保持场景几何结构完整的前提下生成新视角图像；空间漫游功能可模拟三维空间移动轨迹，自动生成逻辑连贯的多视角图像序列；物体空间关系操控功能则能在维持场景整体稳定性的同时，对指定物体进行位移、旋转或缩放操作，并自动优化遮挡关系和光影效果。

这项技术突破为多个行业带来革新可能。在电商领域，商家可通过自然语言指令快速生成多角度商品展示图；创意设计行业能利用空间漫游功能制作沉浸式场景预览；智能图像处理领域可实现更精准的3D模型重建；具身智能研发则获得关键的视觉感知底层支持。开发者现可自由获取模型推理代码，基于其开放架构开发各类商业应用。

技术团队透露，模型训练过程中构建了包含数百万空间标注数据的训练集，特别强化了对室内外场景的空间关系理解能力。其创新的空间坐标编码机制，使模型能够解析物体在三维空间中的绝对位置和相对关系，这项突破解决了开源社区长期存在的空间感知难题。随着模型开源，预计将推动AI图像技术在自动驾驶、机器人导航、虚拟现实等领域的快速落地应用。

更多>同类内容