小米官宣认领“Hunter Alpha” 推出三款大模型 MiMo-V2系列将择机开源

   发布时间:2026-03-19 12:46 作者:钟景轩

近日,全球最大API聚合平台OpenRouter上,一款代号为“Hunter Alpha”的神秘大模型引发广泛关注,其曾一度登顶大模型调用榜,众多网友纷纷猜测它是“DeepSeek V4”的早期版本。就在众人热议之时,小米于凌晨正式宣布认领该模型,并同步推出MiMo-V2-Pro、Omni和TTS三款大模型,用户可限时免费体验一周。

小米MiMo大模型负责人罗福莉随后发布长文,称这是小米首款专为智能体时代打造的全栈产品系列。她将此次成果形容为一次“悄无声息的伏击”,强调并非小米事先精心策划,而是从聊天模式到智能代理模式的转变太过迅速,连团队自身都感到意外,这一过程既充满激动与痛苦,又极具吸引力。

据罗福莉介绍,1T基础模型早在几个月前就已开始训练,最初目标是提升长上下文推理效率。团队采用的混合注意力机制带来了真正创新,既不过度扩张,又成为智能体时代最合适的基石。该模型具备1M上下文窗口,通过MTP推理实现了超低延迟和成本。这些架构决策并非临时起意,而是在需求出现前就构建好的结构性优势。

真正带来变革的是罗福莉首次体验复杂智能体框架时,她将其称为“精心编排的语境”。体验第一天,她就大为震惊,并试图说服团队采用,但未获成功。于是她下达强硬指令,要求MiMo团队成员第二天对话次数必须超过100次,否则可辞职。这一举措奏效,团队成员的想象力被智能体系统的功能激发后,直接转化为研究速度的提升。

当被问及小米为何能发展如此迅速时,罗福莉结合自身构建DeepSeek R1的经验总结道:骨干网和基础设施研究周期漫长,需要一年战略决心才能看到回报;训练后敏捷性是不同能力,产品直觉驱动评估,迭代周期缩短,范式转变能及早发生;同时,好奇心、敏锐技术直觉、果断执行力和全身心投入不可或缺;还有一点常被低估,即对所创造世界的真挚热爱。

罗福莉还承诺,新的MiMo-V2系列模型在足够稳定、值得开源时将会开源。

 
 
更多>同类内容
全站最新
热门内容
 
智快科技微信账号
微信群

微信扫一扫
加微信拉群
电动汽车群
科技数码群