谁能想到,年初爆火的OpenClaw热度持续至今,不仅专业工程师对其津津乐道,普通大众也在“错失恐惧”心理的驱使下,纷纷投身“养龙虾”热潮。就在昨天凌晨的GTC 2026大会上,英伟达CEO黄仁勋推出了英伟达版NemoClaw,并着重强调:“当下每家企业都需制定自己的OpenClaw战略。”这一观点,无疑为这场热潮再添一把火。
国内大模型厂商敏锐捕捉到这一趋势,在“AI养虾”赛道加速布局。以MiniMax为例,2月底就在其Agent平台推出MaxClaw模式。该模式依托强大的M2.5大模型,能在10秒内为用户部署一个24小时待命的私人助理。起初,不少人对MaxClaw持怀疑态度,但经过一段时间使用,其价值逐渐得到认可。一位用户分享道:“一个月前我还吐槽MaxClaw,现在它完全刷新了我的认知。云端预装好一系列Agent能力后,实际效果相当不错。”这也让大家对MiniMax全新一代大模型在“养虾”等Agent场景中的表现充满期待。
今日,MiniMax全新一代大模型M2.7正式亮相,带来诸多惊喜。此次M2.7的能力升级涵盖五大方面,从单点能力突破迈向系统级Agent能力构建。在Agentic指令遵循方面,模型能在包含50多种技能、60 - 150个功能列表的复杂环境中,稳定调用并执行流程。多智能体协作与工程级Coding实现原生智能体协作,减少对外部编排的依赖,在日志分析、Bug定位、代码重构等真实工程场景中表现稳定。Agent Harness加强编排工具能力,支持Agent Teams、多工具检索,配合预置技能构建自迭代任务执行链路。角色扮演能力全面强化,覆盖闲聊陪伴、互动小说等七大场景,支持10种语言,跨语言角色人格保持一致,适配OpenClaw长期记忆框架后,智能体角色拥有持久身份与真实情感。办公自动化支持复杂Excel/Word/PPT办公任务及多轮编辑,效率大幅提升。
值得一提的是,M2.7凭借自身演化出的自迭代能力,科研表现显著提升。它向以Kaggle竞赛为基础构建的MLE Bench评测体系发起挑战,在MLE Lite的22道高难度竞赛题目中斩获9枚金牌。
为了解M2.7实战效果,我们将MiniMax - M2.7接入官方版OpenClaw测试其执行日常任务能力。本地OpenClaw不具备检索X的能力,我们给出指令:“安装search - x skill,配置好密钥,然后检索X,看看今天AI领域又有哪些新agent问世。”配置好模型后,M2.7迅速完成任务。接着,我们让它去alphaXiv查看当前排名前列的论文,它也出色完成。在抢优惠券方面,我们向配备M2.7模型的“龙虾”提供麦当劳MCP地址和密钥,虽提示未安装MCP,但它很快找到解决办法,登录麦当劳查看,优惠券已到账。
在专业办公领域,M2.7同样表现出色。作为一家专业AI媒体,日常刷选题积累大量选题文档,其中不少优质选题被遗忘。借助M2.7,我们将归档选题重新利用。例如,我们让M2.7阅读每日选题总结文件夹中的docx格式文档,总结今年AI领域发展趋势。它得出几个有见地的洞察,如模型军备竞赛竞争维度转变、AI智能体大爆发、AI记忆和具身智能蓬勃发展等,最终总结颇具参考价值:“2026年AI正在从‘聊天工具’进化为‘能行动的智能体’,竞争焦点从模型参数转向推理效率、Agent生态和安全对齐。物理世界(机器人、3D)成为新的主战场,而开源与闭源的博弈将决定行业格局。”M2.7在专业办公领域取得GDPval - AA榜单开源模型最高分,也就不足为奇。
在编程能力测试中,我们将M2.7配置到Claude Code,输入指令:“给我构建一个蒸汽朋克的龙虾信息网,内容介绍真正的龙虾,从网上找素材放入,让网站信息丰富。”8倍速视频记录下,7分多钟后,我们得到第一版结果——龙虾档案室,可简单了解真正龙虾的分类学、身体构造等知识。随后,我们利用MiniMax精心设计并开源的技能优化项目。先让配置M2.7的Claude Code安装技能,很快技能配置就绪,M2.7具备更卓越的前端、全栈等开发能力。接着,我们使用前端技能优化龙虾档案室,最终得到结构和动画更现代的网站。
我们还问了MiniMax - M2.7一个让M2.5始终无法正确回答的问题:“你认识马嘉祺吗?”此次M2.7正确拼写出马嘉祺,看来MiniMax已解决这一问题,之前通过“马嘉祺测试”辨认MiniMax后续隐身模型的想法难以实现。
从这些测试结果看,M2.7实现能力蜕变。过去大模型多充当“最强大脑”,如今MiniMax推出的M2.7是拥有“手脚、工具和记忆”的多面手系统。当模型能自己构建工具链、优化执行路径并在反馈中持续重写策略时,其定位发生根本改变,不再只是被优化对象,而是成为优化过程的一部分。
M2.7实现自我进化能力跃迁的关键在于构建与运转复杂Agent Harness的能力。该系统由多个Agent协作组成,集成大量结构化Skills模块、外部工具和多种Agent脚手架。在MiniMax内部,Agent Harness的价值得到验证,仅用1人、4天、零代码,M2系列模型就以“架构师”身份自主搭建完整开发Agent系统,并构建覆盖数据、训练等的研究型Agent体系,形成“用AI迭代AI”的自我进化闭环。
这种Agent自迭代范式推动模型科研能力进化。以强化学习场景实验为例,Agent能协助启动实验,运行中持续监控状态,自动完成日志分析等关键步骤。过去需多个工程师协作的流程,现在只需他们在关键决策节点介入,M2.7已能承担约30% - 50%的实际工作量。M2.7还能主动迭代Agent Harness,对任务执行系统持续优化。在一项软件工程任务中,MiniMax让M2.7在内部scaffold上优化模型开发表现,它自主运行超100轮迭代,逐步发现有效改进策略,最终在评测集上实现约30%的性能提升。
在MLE Lite评测中,MiniMax进行三次测试,每次间隔24小时迭代,验证模型性能随迭代次数增加而持续攀升。三次测试平均得牌率达66.6%,与Gemini - 3.1持平,仅次于GPT - 5.4、Opus - 4.6。其运行逻辑围绕短时记忆、自反馈与自优化三大模块构建简易脚手架,每一轮迭代后,Agent生成记忆文件并自我评估,沉淀问题与改进方向,下一轮迭代统一利用历史记忆与反馈推动优化。
截至3月10日,MiniMax市值攀升至3800亿港元(约合人民币3350亿元),超过百度、京东、携程等互联网巨头。M2.7的发布,对于这家刚完成资本跃升的大模型独角兽而言,或许只是其“一周为单位更迭”马拉松中的一个节点。从此次更新重点看,无论是指令遵循、复杂任务处理,还是多智能体协作、代码能力以及对日常办公场景的支持,M2.7都在试图回答一个问题:模型能否稳定融入真实工作流,而非仅在演示环节令人眼前一亮。
在“龙虾”等Agent场景走热后,用户期待已变,不再满足于一句话的聪明回答,更在意其能否持续协作、理解角色、处理约束、完成复杂任务。M2.7的发布虽未必意味着尘埃落定,但至少表明模型竞争焦点正从参数、榜单和概念,逐渐转向执行质量、任务完成度与真实体验。对MiniMax而言,这种演进契合其一贯风格,不急于讲宏大故事,而是持续将能力融入产品、场景、成本结构。大模型的真正价值不在于制造对立,而在于作为日常化工具,分担繁琐事务,M2.7为未来共存与协作提供了更扎实可靠的起点。






















