阿里巴巴申请视频生成新专利:融合视听特征提升视频呈现效果

   发布时间:2026-03-06 22:38 作者:柳晴雪

阿里巴巴(中国)有限公司近期在专利领域有了新动作。企查查APP的信息显示,该公司申请公布了一项名为“视频生成方法、视频生成模型的训练方法及任务平台”的专利。

根据专利摘要内容,这项专利涉及一套完整的视频生成技术体系,涵盖视频生成方法、视频生成模型的训练方法以及任务平台。具体而言,在视频生成方法中,首先要获取参考图像和参考音频,其中参考图像需包含参考对象的视觉信息。接着,系统会分别针对参考图像中的视觉信息提取参考对象的视觉特征,同时对参考音频提取音频特征。随后,基于视觉特征与音频特征之间的交互特性,预测在音频特征影响下目标对象的参考动作信息,这里的目标对象是基于参考对象生成的。最后,依据参考动作信息和参考音频,生成目标对象对应的视频。

该专利技术的一大亮点在于,能够有效提升视频中目标对象的视觉信息与对应音频的匹配程度,进而显著改善视频的呈现效果。这一创新成果有望为视频生成领域带来新的技术突破和应用可能。

 
 
更多>同类内容
全站最新
热门内容
 
智快科技微信账号
微信群

微信扫一扫
加微信拉群
电动汽车群
科技数码群