OpenAI布局无屏交互新赛道 语音AI将实现实时对话 硬件设备或明年面世

   发布时间:2026-01-07 02:52 作者:顾青青

据外媒报道,OpenAI正加速推进语音AI技术革新与硬件产品布局,计划于2026年第一季度推出新一代语音AI模型,并同步研发首款完全依赖语音交互的个人设备。这一战略标志着OpenAI从纯软件服务向“软硬一体”生态的转型,其硬件产品矩阵可能涵盖智能眼镜、无屏音箱等形态,试图重新定义人机交互方式。

新一代语音AI模型的核心突破在于实现“类人对话”体验。通过架构重构,该模型支持用户说话时同步播报,并能灵活应对打断、插话等场景,延迟与音质接近真实对话。其技术路径可追溯至OpenAI此前布局:2022年推出的Whisper系统解决了语音识别精度问题,2025年发布的GPT-realtime模型则探索了低延迟连续交互。此次升级整合了工程、产品与研究团队资源,旨在弥补语音模型在准确性与响应速度上与文本模型的差距。

驱动语音模型的技术底座与ChatGPT文本模型存在差异,项目由语音AI研究员昆丹·库马尔主导。他今年夏天从Character.AI加入OpenAI,此前该公司以AI陪伴应用闻名。产品研究主管本·纽豪斯与多模态ChatGPT产品经理杰基·香农亦参与核心开发,后者曾推动OpenAI基础设施向语音模型适配。

硬件层面,OpenAI正研发一款无屏语音设备,用户可通过语音指令完成目标管理、环境感知等任务。设备需授权访问摄像头与麦克风,以分析用户状态与场景信息,提供情境化建议。例如,在烹饪时主动提示步骤,或在会议中提醒日程安排。该设备研发团队吸纳了前苹果首席设计官乔纳森·艾维创立的io公司成员,后者于2025年5月被OpenAI以近65亿美元收购,约55名设计师加入硬件设计工作。

OpenAI的硬件战略并非单一产品,而是分阶段推出系列设备。内部讨论的形态包括智能眼镜与无屏音箱,均以“去屏幕化”为设计原则。乔纳森·艾维认为,此类设备可减少用户对屏幕的依赖,修复消费电子产品带来的成瘾问题。这一理念与谷歌、亚马逊等巨头的布局形成呼应——后者均认为现有设备形态未充分释放AI潜力,需通过可穿戴设备等新形态抢占未来入口。

然而,OpenAI面临用户习惯培养的挑战。前员工透露,大量ChatGPT用户因体验不成熟或缺乏认知,尚未形成语音交互习惯。这要求OpenAI在推出硬件前,需先通过软件迭代提升语音功能渗透率。例如,在移动端优化语音输入响应速度,或通过营销活动引导用户尝试语音交互。

行业观察者指出,OpenAI的转型反映了AI公司从“算法提供方”向“生态构建者”的演进趋势。通过硬件载体,AI技术可更深度融入用户生活场景,形成数据闭环与粘性优势。但这一路径也充满风险:硬件研发周期长、成本高,且需面对苹果、三星等巨头的竞争。OpenAI能否在语音交互领域复制ChatGPT的成功,仍需观察其技术落地与市场接受度。

 
 
更多>同类内容
全站最新
热门内容
 
智快科技微信账号
微信群

微信扫一扫
加微信拉群
电动汽车群
科技数码群