商汤科技发布日日新6.5,打造办公智能助手,推出具身智能平台赋能机器人

   发布时间:2025-07-30 02:18 作者:赵云飞

在2025年世界人工智能大会WAIC上,商汤科技带来了一系列震撼业界的创新成果。会上,商汤正式推出了“日日新SenseNova V6.5”大模型体系与“悟能”具身智能平台,并对旗下的明星产品商汤小浣熊进行了智能体升级。

日日新V6.5大模型体系在强推理、高效率及智能体三大方面进行了重点升级。该版本率先突破了图文交错思维链技术,使AI模型能够更直观地理解和处理图像与文字交织的信息。商汤科技CEO徐立表示,之所以选择推出V6.5而非V7,是因为他们希望进一步扩充多模态思维链构造数据,结合商汤在视觉感知领域的优势,通过图文关系的深度挖掘,推动模型核心能力的飞跃。

在性能表现上,日日新V6.5的文本推理能力和多模态推理能力均超越了Gemini 2.5 Pro和Claude-4 Sonnet,其多模态交互能力也领先Gemini 2.5 Flash和GPT-4o。这一突破得益于商汤对多模态模型融合架构的改进,新的架构不仅减轻了视觉编码器的负担,还通过深而窄的主干模型,实现了视觉与语言表征的早期对齐与融合,从而提高了感知效率和模态融合的深度。

基于日日新V6.5的多模态数据分析能力,商汤小浣熊也迎来了全面升级。升级后的商汤小浣熊能够处理复杂的多模态输入,进行深度融合分析,并以多模态形式输出结果。在数据分析和智能体领域的测试中,商汤小浣熊的表现达到了国际标杆Claude 4 Opus的水平,远超OpenAI o3等模型。在实际办公场景中,商汤小浣熊能够解析复杂的Excel表格,通过多模态思维链构造进行全局分析,最终生成结构化的报告。

商汤小浣熊还推出了教育版和金融版,针对不同行业的需求提供定制化服务。教育版能够智能分析学生的学习表现和行为模式,已在多所院校协助提升教学效率和学生心理健康水平。金融版则提供知识助手、智能问数和多模态智能理赔等解决方案,构建金融领域的“人机协同”智能决策新范式。

“悟能”具身智能平台是商汤科技的另一项重磅创新。该平台以商汤的具身世界模型为核心引擎,为机器人等智能终端提供强大的感知、视觉导航和多模态交互能力。徐立在现场展示了搭载具身世界引擎的人形机器人,它能够生动地讲解PPT,语言自然流畅,还能回答观众的问题,进行阶段性小结。

商汤的具身世界模型不仅能够生成多视角视频,还能构建面向人、物、场的4D真实世界。用户只需输入简单的提示词,模型就能自主进行位姿、动作骨架和指令的生成,实现与真实世界的深度交互。这一技术突破为机器人等智能终端提供了前所未有的自主化与智能化水平。

在WAIC的商汤科技展台上,吸引了众多参观者驻足。会解说PPT的人形机器人成为全场焦点,它基于日日新V6.5多模态大模型,拥有强大的音视频处理和AI交互能力,能够在嘈杂环境中完成实时流畅的互动。傅利叶、钛虎等多家机器人也亮相商汤展台,展示了基于日日新V6.5多模态大模型的智能硬件产品。

商汤科技还展示了其AI基础设施商汤大装置、“开悟”世界模型以及各类AI原生应用,如商汤商量、办公小浣熊、代码小浣熊等。这些创新成果不仅展现了商汤在人工智能领域的深厚积累,也预示着AI技术正在逐步触达AGI边界,向“类人”标准靠近。

 
 
更多>同类内容
全站最新
热门内容
本栏最新
 
智快科技微信账号
微信群

微信扫一扫
加微信拉群
电动汽车群
科技数码群