谷歌Gemini 3 Pro上线：多模态交互升级，AI“执行者”时代来临-快讯-智快网

谷歌Gemini 3 Pro上线：多模态交互升级，AI“执行者”时代来临

发布时间：2025-11-22 13:50 来源：快讯作者：任飞扬

谷歌近日正式上线了其最新旗舰模型Gemini 3 Pro，这款被公司称为迄今为止“最智能”且“最准确”的模型，不仅在编码和推理能力上实现了显著提升，还大幅减少了“谄媚式”回应，转而提供更加直接和实用的信息。这一举措被视为谷歌对竞争对手ChatGPT的直接回应，标志着人工智能领域的新一轮竞争正式拉开帷幕。

Gemini 3 Pro的最大亮点在于其“原生多模态”特性，能够同时处理文本、图像和音频，打破了传统模型仅限于文本交互的局限。谷歌官方演示中，该模型不仅流畅地处理了RNA数据，还展示了翻译菜谱照片为食谱、根据视频讲座创建交互式学习卡片等实用功能。在Gemini应用中，用户还能利用内置的Canvas构建功能更全面的程序，支持“生成式界面”，创建包含图片的杂志式视觉格式，或根据用户提示定制动态布局的用户界面。

搜索功能方面，Gemini 3 Pro同样表现出色。它能够根据用户搜索呈现图像、表格、网格和模拟等视觉元素，通过分解问题并理解用户意图，找到之前可能遗漏的新内容。谷歌DeepMind高级总监兼产品负责人Tulsee Doshi表示，这一模型将助力谷歌实现“人人皆可获取且人人皆可使用”的信息目标，推动搜索引擎向更丰富、更完整的实际内容展示迈进。

在回应风格上，Gemini 3 Pro也进行了显著调整。谷歌强调，该模型的回复将更加“智能、简洁、直接”，摒弃陈词滥调和奉承，提供真正的洞见。这一变化被视为对ChatGPT等模型空洞奉承式回应的直接挑战，旨在为用户提供更加实用和有价值的信息。

除了上述改进外，Gemini 3 Pro还具备更强大的推理和智能代理能力，能够完成更复杂的任务并可靠地进行长期规划。谷歌表示，该模型为Gemini Agent的实验性功能提供支持，可在应用内帮助用户执行查看和整理电子邮件、搜索和预订旅行等任务。

在性能方面，Gemini 3 Pro在官方21项基准测试中表现优异，除OCR和代理编码外，其他指标均遥遥领先。谷歌还特别强调了人类最终测试、终端工作台2.0和SimpleQA Verified三个指标，矛头直指Claude Sonnet4.5和GPT-5.1等竞争对手，试图证明其在标准化知识生成、AI工具使用乃至“人工智能”整体指标上的全方位优势。

与此同时，谷歌还推出了基于Gemini 3 Pro及其他第三方模型的开发工具Antigravity。这款工具支持多个智能体直接访问编辑器、终端和浏览器，旨在面向“智能体优先的未来”。Antigravity具有生成“工件”文件以验证工作进度、报告操作和外部工具使用情况等功能，并提供了编辑器视图和管理器视图两种主要使用视图，方便用户同时控制多个代理。

谷歌表示，Antigravity中的代理能够从过去的工作中学习，保留特定代码片段或执行任务所需步骤。在官方演示中，该工具成功构建并测试了一个基本的航班跟踪应用程序，并通过浏览器录制报告了测试结果。目前，Antigravity已推出公开预览版，兼容Windows、macOS和Linux系统。

谷歌此次的发布不仅限于一个大模型，更展示了其构建从模型、应用到开发者的完整生态闭环的野心。随着多模态交互的普及，AI正从一位博学的“对话者”转变为能看、能听、能行动、能规划的“执行者”。这一转变预示着未来3D和全景、沉浸式交互竞赛的临近，人工智能领域将迎来更加激烈的竞争和更加广阔的发展前景。

更多>同类内容