MiniMax M2.7发布：从“大脑”到系统，AI龙虾开启自我进化新征程-科技-智快网

谁能想到，年初爆火的OpenClaw热度持续至今，不仅专业工程师对其津津乐道，普通大众也在“错失恐惧”心理的驱使下，纷纷投身“养龙虾”热潮。就在昨天凌晨的GTC 2026大会上，英伟达CEO黄仁勋推出了英伟达版NemoClaw，并着重强调：“当下每家企业都需制定自己的OpenClaw战略。”这一观点，无疑为这场热潮再添一把火。

国内大模型厂商敏锐捕捉到这一趋势，在“AI养虾”赛道加速布局。以MiniMax为例，2月底就在其Agent平台推出MaxClaw模式。该模式依托强大的M2.5大模型，能在10秒内为用户部署一个24小时待命的私人助理。起初，不少人对MaxClaw持怀疑态度，但经过一段时间使用，其价值逐渐得到认可。一位用户分享道：“一个月前我还吐槽MaxClaw，现在它完全刷新了我的认知。云端预装好一系列Agent能力后，实际效果相当不错。”这也让大家对MiniMax全新一代大模型在“养虾”等Agent场景中的表现充满期待。

今日，MiniMax全新一代大模型M2.7正式亮相，带来诸多惊喜。此次M2.7的能力升级涵盖五大方面，从单点能力突破迈向系统级Agent能力构建。在Agentic指令遵循方面，模型能在包含50多种技能、60 - 150个功能列表的复杂环境中，稳定调用并执行流程。多智能体协作与工程级Coding实现原生智能体协作，减少对外部编排的依赖，在日志分析、Bug定位、代码重构等真实工程场景中表现稳定。Agent Harness加强编排工具能力，支持Agent Teams、多工具检索，配合预置技能构建自迭代任务执行链路。角色扮演能力全面强化，覆盖闲聊陪伴、互动小说等七大场景，支持10种语言，跨语言角色人格保持一致，适配OpenClaw长期记忆框架后，智能体角色拥有持久身份与真实情感。办公自动化支持复杂Excel/Word/PPT办公任务及多轮编辑，效率大幅提升。

值得一提的是，M2.7凭借自身演化出的自迭代能力，科研表现显著提升。它向以Kaggle竞赛为基础构建的MLE Bench评测体系发起挑战，在MLE Lite的22道高难度竞赛题目中斩获9枚金牌。

为了解M2.7实战效果，我们将MiniMax - M2.7接入官方版OpenClaw测试其执行日常任务能力。本地OpenClaw不具备检索X的能力，我们给出指令：“安装search - x skill，配置好密钥，然后检索X，看看今天AI领域又有哪些新agent问世。”配置好模型后，M2.7迅速完成任务。接着，我们让它去alphaXiv查看当前排名前列的论文，它也出色完成。在抢优惠券方面，我们向配备M2.7模型的“龙虾”提供麦当劳MCP地址和密钥，虽提示未安装MCP，但它很快找到解决办法，登录麦当劳查看，优惠券已到账。

在专业办公领域，M2.7同样表现出色。作为一家专业AI媒体，日常刷选题积累大量选题文档，其中不少优质选题被遗忘。借助M2.7，我们将归档选题重新利用。例如，我们让M2.7阅读每日选题总结文件夹中的docx格式文档，总结今年AI领域发展趋势。它得出几个有见地的洞察，如模型军备竞赛竞争维度转变、AI智能体大爆发、AI记忆和具身智能蓬勃发展等，最终总结颇具参考价值：“2026年AI正在从‘聊天工具’进化为‘能行动的智能体’，竞争焦点从模型参数转向推理效率、Agent生态和安全对齐。物理世界（机器人、3D）成为新的主战场，而开源与闭源的博弈将决定行业格局。”M2.7在专业办公领域取得GDPval - AA榜单开源模型最高分，也就不足为奇。

在编程能力测试中，我们将M2.7配置到Claude Code，输入指令：“给我构建一个蒸汽朋克的龙虾信息网，内容介绍真正的龙虾，从网上找素材放入，让网站信息丰富。”8倍速视频记录下，7分多钟后，我们得到第一版结果——龙虾档案室，可简单了解真正龙虾的分类学、身体构造等知识。随后，我们利用MiniMax精心设计并开源的技能优化项目。先让配置M2.7的Claude Code安装技能，很快技能配置就绪，M2.7具备更卓越的前端、全栈等开发能力。接着，我们使用前端技能优化龙虾档案室，最终得到结构和动画更现代的网站。

我们还问了MiniMax - M2.7一个让M2.5始终无法正确回答的问题：“你认识马嘉祺吗？”此次M2.7正确拼写出马嘉祺，看来MiniMax已解决这一问题，之前通过“马嘉祺测试”辨认MiniMax后续隐身模型的想法难以实现。

从这些测试结果看，M2.7实现能力蜕变。过去大模型多充当“最强大脑”，如今MiniMax推出的M2.7是拥有“手脚、工具和记忆”的多面手系统。当模型能自己构建工具链、优化执行路径并在反馈中持续重写策略时，其定位发生根本改变，不再只是被优化对象，而是成为优化过程的一部分。

M2.7实现自我进化能力跃迁的关键在于构建与运转复杂Agent Harness的能力。该系统由多个Agent协作组成，集成大量结构化Skills模块、外部工具和多种Agent脚手架。在MiniMax内部，Agent Harness的价值得到验证，仅用1人、4天、零代码，M2系列模型就以“架构师”身份自主搭建完整开发Agent系统，并构建覆盖数据、训练等的研究型Agent体系，形成“用AI迭代AI”的自我进化闭环。

这种Agent自迭代范式推动模型科研能力进化。以强化学习场景实验为例，Agent能协助启动实验，运行中持续监控状态，自动完成日志分析等关键步骤。过去需多个工程师协作的流程，现在只需他们在关键决策节点介入，M2.7已能承担约30% - 50%的实际工作量。M2.7还能主动迭代Agent Harness，对任务执行系统持续优化。在一项软件工程任务中，MiniMax让M2.7在内部scaffold上优化模型开发表现，它自主运行超100轮迭代，逐步发现有效改进策略，最终在评测集上实现约30%的性能提升。

在MLE Lite评测中，MiniMax进行三次测试，每次间隔24小时迭代，验证模型性能随迭代次数增加而持续攀升。三次测试平均得牌率达66.6%，与Gemini - 3.1持平，仅次于GPT - 5.4、Opus - 4.6。其运行逻辑围绕短时记忆、自反馈与自优化三大模块构建简易脚手架，每一轮迭代后，Agent生成记忆文件并自我评估，沉淀问题与改进方向，下一轮迭代统一利用历史记忆与反馈推动优化。

截至3月10日，MiniMax市值攀升至3800亿港元（约合人民币3350亿元），超过百度、京东、携程等互联网巨头。M2.7的发布，对于这家刚完成资本跃升的大模型独角兽而言，或许只是其“一周为单位更迭”马拉松中的一个节点。从此次更新重点看，无论是指令遵循、复杂任务处理，还是多智能体协作、代码能力以及对日常办公场景的支持，M2.7都在试图回答一个问题：模型能否稳定融入真实工作流，而非仅在演示环节令人眼前一亮。

在“龙虾”等Agent场景走热后，用户期待已变，不再满足于一句话的聪明回答，更在意其能否持续协作、理解角色、处理约束、完成复杂任务。M2.7的发布虽未必意味着尘埃落定，但至少表明模型竞争焦点正从参数、榜单和概念，逐渐转向执行质量、任务完成度与真实体验。对MiniMax而言，这种演进契合其一贯风格，不急于讲宏大故事，而是持续将能力融入产品、场景、成本结构。大模型的真正价值不在于制造对立，而在于作为日常化工具，分担繁琐事务，M2.7为未来共存与协作提供了更扎实可靠的起点。