火山引擎FORCE大会:豆包2.1 Pro与Seedance 2.5登场,国产AI模型再攀高峰

   发布时间:2026-06-23 22:23 作者:杨凌霄

在2026火山引擎FORCE原动力大会上,火山引擎总裁谭待公布了一个令人瞩目的数据:截至今年6月,豆包大模型的日均token调用量已达180万亿,相比最初发布时增长了多个数量级,且增长势头丝毫未减。这一数字公布时,台下掌声雷动,凸显了业界对火山引擎在AI领域成就的认可。在公有云大模型市场,火山引擎的市场份额已提升至49.5%,意味着每消耗两个token,就有一个来自火山引擎。

“万亿token俱乐部”的成员数量也在快速增长。去年12月,该俱乐部仅有100家企业,如今已暴涨至200多家。这一变化表明,token正逐渐成为企业运营中不可或缺的基础资源,如同水电一般。越来越多的企业开始将大模型深度融入核心业务流程,包括代码编写、视频制作、数据分析、客户服务以及决策支持等。

大会的焦点无疑是新发布的豆包大模型2.1 Pro。谭待称其为突破“生产质变点”的旗舰模型,意味着其编写的代码能够真正交付并应用于企业研发流程,而不仅仅是停留在实验阶段。在coding能力方面,豆包2.1 Pro在多个权威评测中表现出色。例如,在Terminal Bench终端编程评测中,它与Claude Opus 4.7并驾齐驱,跻身全球第一梯队;在SciCode科研问题评测中,它以59.8分的成绩超越了Opus 4.7;在仓库级评测中,它也取得了47分的优异成绩。

现场还展示了一个硬核案例:豆包2.1 Pro围绕一个16×16 PE的微型模型,连续运行18小时、迭代九轮,最终生成了六个核心模块和1300多行RTL代码,这是芯片设计中最严谨的环节之一,通常需要3到5名资深工程师数周时间才能完成。而且,该模型不仅生成了代码,还通过了仿真测试、综合检测以及手写数字识别验证。

在Agent能力方面,豆包2.1 Pro同样表现出色。在OpenAI的GDPval真实经济价值评测中,它在国内排名第一;在MCP Atlas评测中,它全面超越了Opus 4.7。价格方面,豆包2.1 Pro也极具竞争力。百万token输入仅需6元,输出30元,缓存命中更是低至1.2元,相比Claude同系列成本降低了近80%。还推出了价格仅为Pro一半的turbo版本。

视频生成领域也迎来了重大突破。今年2月发布的Seedance 2.0是中国首个全球SOTA视频生成模型,也是首个跨过“生产质变点”的模型。它解锁了15到30秒的广告、影视和科普短片生成能力。此次大会上,Seedance 2.0迎来了原生4K升级,能够生成更高清晰度的视频,保留更多细节信息,如发丝、丝线走向和面料纹理等。同时,它还率先支持4K 10bit高位深,为后期调色提供了更多空间。

然而,4K画质只是开始。Seedance 2.5的登场更是引发了广泛关注。该模型目前处于内测尾声阶段,预计7月初正式发布。它带来了三个全球领先的升级:单条视频生成长度最高可达30秒,突破了市面上同类模型15到20秒的限制;多参考能力支持50个全模态素材联合输入,为视频创作提供了更多可能性;更灵活的视频编辑功能允许在整体画面不变的前提下对局部进行单独修改,如微调背景、更换商品或模特等。

在实体产业中,Seedance 2.5也展现出了巨大的应用潜力。它能够自动生成多语言产品视频说明书,为具身智能合成多场景多视角的高质量训练数据,还能为自动驾驶合成极端天气和罕见路况等训练案例,填补训练盲区。随着视频模型不断跨过生产质变点,其对物理世界的理解正在成为构建世界模型的重要基础。

除了视频和代码生成模型外,火山引擎还在图像和音频领域推出了新成果。图像方面,Seedream 5.0 Pro带来了交互式精准编辑和多图层分离等创新功能。创作者既可以用语言描述空间关系,也可以直接在画面上标记圈选,模型能够识别意图并生成符合要求的画面。同时,它还支持将任意区域拆分输出成独立图层,并递归拆分以方便二次编辑。Seedream 5.0 Pro还具备高密度信息呈现能力,能够将复杂图表、多层结构甚至一整页PPT的信息量完整塞进一张图中,并自动优化版面保持审美。

音频方面,Seed-Audio 1.0支持情绪、口音、背景音、氛围音和拟音特效一次直出,达到影视级成品音效水平。在产业侧,奔驰和东风等企业已经基于豆包大模型探索智能座舱的语音交互应用。奔驰中国研发负责人在现场视频中提到,他们已经将豆包大模型集成进新款纯电车型中,使车内的对话更加自然、更能读懂用户意图和情绪。

 
 
更多>同类内容
全站最新
热门内容
 
智快科技微信账号
微信群

微信扫一扫
加微信拉群
电动汽车群
科技数码群