谷歌近日正式上线了其最新旗舰模型Gemini 3 Pro,这款被公司称为迄今为止“最智能”且“最准确”的模型,不仅在编码和推理能力上实现了显著提升,还大幅减少了“谄媚式”回应,转而提供更加直接和实用的信息。这一举措被视为谷歌对竞争对手ChatGPT的直接回应,标志着人工智能领域的新一轮竞争正式拉开帷幕。
Gemini 3 Pro的最大亮点在于其“原生多模态”特性,能够同时处理文本、图像和音频,打破了传统模型仅限于文本交互的局限。谷歌官方演示中,该模型不仅流畅地处理了RNA数据,还展示了翻译菜谱照片为食谱、根据视频讲座创建交互式学习卡片等实用功能。在Gemini应用中,用户还能利用内置的Canvas构建功能更全面的程序,支持“生成式界面”,创建包含图片的杂志式视觉格式,或根据用户提示定制动态布局的用户界面。
搜索功能方面,Gemini 3 Pro同样表现出色。它能够根据用户搜索呈现图像、表格、网格和模拟等视觉元素,通过分解问题并理解用户意图,找到之前可能遗漏的新内容。谷歌DeepMind高级总监兼产品负责人Tulsee Doshi表示,这一模型将助力谷歌实现“人人皆可获取且人人皆可使用”的信息目标,推动搜索引擎向更丰富、更完整的实际内容展示迈进。
在回应风格上,Gemini 3 Pro也进行了显著调整。谷歌强调,该模型的回复将更加“智能、简洁、直接”,摒弃陈词滥调和奉承,提供真正的洞见。这一变化被视为对ChatGPT等模型空洞奉承式回应的直接挑战,旨在为用户提供更加实用和有价值的信息。
除了上述改进外,Gemini 3 Pro还具备更强大的推理和智能代理能力,能够完成更复杂的任务并可靠地进行长期规划。谷歌表示,该模型为Gemini Agent的实验性功能提供支持,可在应用内帮助用户执行查看和整理电子邮件、搜索和预订旅行等任务。
在性能方面,Gemini 3 Pro在官方21项基准测试中表现优异,除OCR和代理编码外,其他指标均遥遥领先。谷歌还特别强调了人类最终测试、终端工作台2.0和SimpleQA Verified三个指标,矛头直指Claude Sonnet4.5和GPT-5.1等竞争对手,试图证明其在标准化知识生成、AI工具使用乃至“人工智能”整体指标上的全方位优势。
与此同时,谷歌还推出了基于Gemini 3 Pro及其他第三方模型的开发工具Antigravity。这款工具支持多个智能体直接访问编辑器、终端和浏览器,旨在面向“智能体优先的未来”。Antigravity具有生成“工件”文件以验证工作进度、报告操作和外部工具使用情况等功能,并提供了编辑器视图和管理器视图两种主要使用视图,方便用户同时控制多个代理。
谷歌表示,Antigravity中的代理能够从过去的工作中学习,保留特定代码片段或执行任务所需步骤。在官方演示中,该工具成功构建并测试了一个基本的航班跟踪应用程序,并通过浏览器录制报告了测试结果。目前,Antigravity已推出公开预览版,兼容Windows、macOS和Linux系统。
谷歌此次的发布不仅限于一个大模型,更展示了其构建从模型、应用到开发者的完整生态闭环的野心。随着多模态交互的普及,AI正从一位博学的“对话者”转变为能看、能听、能行动、能规划的“执行者”。这一转变预示着未来3D和全景、沉浸式交互竞赛的临近,人工智能领域将迎来更加激烈的竞争和更加广阔的发展前景。






















