字节Seedance 2.0论文亮相：170人团队署名，吴永辉曾妍领衔，技术突破引关注-快讯-智快网

字节Seedance 2.0论文亮相：170人团队署名，吴永辉曾妍领衔，技术突破引关注

发布时间：2026-04-17 16:30 来源：天脉网作者：柳晴雪

字节跳动旗下AI视频生成技术Seedance 2.0近日在学术平台arXiv发布技术论文，同步公开26页详细评测报告及170人完整研发团队名单。这项被业界称为"现象级"的多模态视频生成技术，通过原生统一模型架构实现了文本、图像、视频、音频的跨模态理解与生成，在动作自然度、音画同步性、导演级分镜控制等维度达到行业领先水平。

技术突破直指传统生成式工具的核心痛点。过往模型依赖单一文本输入，在整合品牌素材、配音、历史片段时存在显著一致性缺陷，创作者需经历数十次试错才能获得可用成果。Seedance 2.0通过构建四模态统一理解框架，支持混合输入指令的实时解析，使人物运动轨迹更符合物理规律，多人交互场景不再出现逻辑错乱。其自研的音画对齐算法可精准匹配口型、脚步声、背景音乐与画面动态，在评测中实现98.7%的同步准确率。

该技术已通过Byteplus平台向全球100余个国家企业开放API调用服务，支持生成4-15秒、分辨率最高达720p的短视频内容。值得注意的是，服务覆盖范围特意排除了美国市场。企业用户可实现剧情脚本的自动分镜、运镜设计与节奏剪辑，还能对指定角色、动作或场景进行局部修改，或在现有视频基础上无缝续拍新内容。

在VBench等主流基准测试中，Seedance 2.0在质量、运动合理性、语义一致性等23项指标中全面领先同期竞品。论文披露的对比数据显示，其人物动作自然度评分超出第二名14.6个百分点，复杂场景生成效率提升3倍以上。研发团队特别强调，模型通过引入物理引擎约束模块，使奔跑、打斗等动态场景的失真率降低至2.3%。

团队构成显示剧烈人事变动：相较1.5 Pro版本，现有170人团队中有89人离职，同时引入62名新成员，核心研发层保持稳定。基础研究负责人吴永辉直接向CEO梁汝波汇报，预训练技术路线由位于帕洛阿尔托的曾妍团队主导。值得关注的是，抖音副总裁李亮近日否认了"亿元年薪挖角"传闻，但确认Seed团队采用"现金+字节期权+豆包期权"的复合薪酬体系，期权四年全部归属，业务发展良好时技术人员收益可能达数亿元级别。

更多>同类内容