在AI技术飞速发展的当下,企业级应用正迎来新的突破。近日,火山引擎在FORCE原动力大会上宣布,豆包大模型1.8版本正式发布,同时推出多项创新技术,为企业AI应用提供更强大的支持。这一系列举措标志着AI技术正从实验室走向规模化落地,为企业带来实实在在的生产力提升。
豆包大模型1.8版本在多模态理解和Agent能力方面实现了显著提升。该模型在设计之初就针对多模态Agent场景进行了优化,在多轮交互、复杂指令遵循以及操作系统级Agent操作等方面表现出色。特别是在视觉能力上,新版本进行了底层升级,能够以低帧率处理超长视频,并在视频语义解析、空间关系理解和文档结构化处理等方面取得突破性进展。原生支持的智能上下文管理机制,使模型在执行超长、多步骤任务时能够自动清理历史信息,确保任务持续稳定完成。
火山引擎总裁谭待在大会上分享了一组令人瞩目的数据:截至目前,豆包大模型的日均Token使用量已突破50万亿,较去年同期增长超过10倍,自发布以来更是增长了417倍。已有超过100家企业客户的累计Token使用量超过一万亿,显示出企业级AI应用正在快速规模化。谭待强调,火山引擎一直致力于通过技术创新降低成本,推动模型降价策略,目前已有更多厂商跟进这一趋势,共同做大市场蛋糕。
在视频生成领域,火山引擎也取得了重要进展。去年春季发布的视频模型Seedance 1.0,如今已升级至1.5 Pro版本。新版本采用原生音视频联合生成架构,支持环境音、背景音乐和人声等多种元素,实现了毫秒级的音画同步输出。更值得一提的是,Seedance 1.5 Pro支持多人跨语对话,能够根据画面中说话角色的数量和景深信息,实现精准的口型匹配,有效解决了"张口不发声"或口型错位等问题。该模型还原生支持多语言及多种中文方言,包括四川话、粤语和上海话等,大大拓展了视频内容创作的实用边界。
为了帮助企业更好地实现Agent的规模化落地,火山引擎推出了推理代工服务,支持极致弹性伸缩、全栈推理优化和分布式缓存。这项服务就像一台已调校完成的顶级赛车,企业只需将模型"插入发动机"即可快速运行。针对企业构建Agent过程中面临的身份权限管理、黑盒测试、存量系统智能化等挑战,火山引擎发布了AI Agent平台AgentKit+HiAgent技术体系。
AgentKit构建了一套让Agent走向生产规模化落地的基础设施底座,具备身份认证、运行时管理、云沙箱、网关、记忆库、可观测性、评测和安全围栏等功能。与传统开发方式相比,AgentKit大幅简化了开发流程。传统开发需要手动调用模型、解析结果并处理各种状态和异常,前后端代码量至少需要1500至2000行。而使用AgentKit后,前端Agent仅需约50行代码,后端十几行即可完成简单串联,整套实现控制在61行以内,代码量减少约96%,同时开发和运行稳定性也大幅提升。
去年发布的HiAgent解决方案也在不断迭代,今年推出了"1+N+X"体系,即一个统一AI任务调度入口、N个企业通用智能体和X个业务定制智能体应用,帮助企业加速Agent的规模化落地。这些创新技术正在推动AI从技术潜力转化为实实在在的行业生产力,为企业带来新的增长机遇。





















