谷歌CEO确认:Gemini3年内发布，AI Agent能力或成突破口

AI资讯 8小时前硕雀

2 0 0

一、发布计划概览

在2025年11月的财报电话会议上，谷歌CEO桑达尔·皮查伊确认，下一代大模型 Gemini 3 将于2025年内正式发布。
该模型定位为 Gemini 2.5 Pro 的后继者，目标在性能上进一步缩小与 OpenAI GPT‑5 的差距，并把 ‍“智能代理（AI Agent）”‍ 能力设为核心突破口。

二、Gemini 3 的关键技术特性

维度	预计提升/新特性	说明
模型规模与多模态	更大参数规模、原生支持图像、音频，后续计划加入视频处理	继续沿用全模态（r）路线，提升跨媒体感知能力
上下文长度	无限上下文窗口（百万级 token）	支持长视频、文档全链路分析，提升复杂任务的连续推理能力
推理与规划	引入更高效的规划算法和自适应记忆机制	让模型在面对不确定任务时能够主动制定计划、动态调整策略
工具调用（Agent）‍	原生具备 Tool‑use、API 调用、网页浏览等能力	通过 Gemini App 与 Project Astra 将 Agent 能力落地为可交互的“数字身体”
效率与成本	更快的推理速度、更低的算力消耗	通过模型结构优化和 MoE（Mixture‑of‑Experts）等技术实现，降低部署门槛

三、AI Agent 能力的突破点

工具使用与自动化
- Gemini 3 将内置 Agent 框架，能够自主调用搜索、计算、代码执行等外部工具，实现“思考‑行动”闭环。
- 在 Gemini 2.5 Pro 的 Deep Research Agent 中已展示自动浏览网页、任务优先级排序等功能，Gemini 3 将进一步提升准确率和任务完成度。
记忆与反思
- 新增长期记忆模块，使模型能够在多轮交互中保留关键信息，并在后续任务中进行自我反思与改进。
多模态感知
- 原生支持图像、音频，计划扩展到视频，使 Agent 能在真实环境中“看到”“听到”并做出决策，适用于智能助理、内容创作等场景。
生态化落地
- Gemini App 与 Project Astra（已在 Gemini Live 中上线）将 Agent 能力包装为可直接使用的产品形态，面向普通用户和企业开发者提供“一站式”AI 助手。
- Gemini Kit 与 NotebookLM 为开发者提供快速原型和知识传播的工具链，进一步推动 Agent 技术在创业和科研中的落地。

四、与前代及竞争对手的对比

对比维度	Gemini 2.5 Pro	Gemini 3（预期）	GPT‑5（公开信息）
参数规模	约 540 B	预计 > 800 B	约 1 T（传闻）
多模态	图像+音频	图像+音频+视频	主要文本，部分图像
上下文窗口	8 K token	1 M token	8 K token
Agent 能力	基础工具调用	深度规划、记忆、自动化	已具备工具调用，但深度规划仍受限
性能（Humanity’s Last Exam）	7.95 %	预计 > 25 %	未公开具体数据

从公开数据看，Gemini 3 在 多模态深度感知、长上下文、Agent 自主规划 等方面将显著领先于 Gemini 2.5 Pro，并在与 GPT‑5 的竞争中缩小差距。

五、生态与应用场景

个人助理：在 Gemini App 中实现“一键完成旅行预订、邮件撰写、代码调试”等全链路任务。
企业流程自动化：通过 Gemini Kit 为业务流程提供 AI Agent‑驱动的自动化方案（如财务报表生成、客服智能分流）。
内容创作：NotebookLM 结合音频、视频生成，实现“一键生成多媒体教材、营销视频”。
研发与教育：Agent 能在代码编写、实验设计、文献检索等环节提供实时辅助，提升科研效率。

六、行业影响与风险提示

技术红利：Agent 能力的成熟将推动 AI 从“指令‑响应”向“主动规划、执行”转变，带动云计算、算力、数据标注等上下游产业的需求增长。
竞争格局：谷歌通过 Gemini 3 抢占多模态+Agent 赛道，可能加速 OpenAI、微软等在工具调用和长上下文方面的迭代。
安全与合规：更强的自主决策能力也意味着潜在的误操作和信息安全风险，谷歌已表示将在发布前加强模型对齐与安全评估。

总结：Gemini 3 将在 2025 年内面世，核心聚焦 AI Agent 能力的系统性提升——包括更强的工具使用、长期记忆、跨模态感知以及大幅扩展的上下文窗口。它不仅是 Gemini 系列的性能升级，更是谷歌把大模型从“聊天工具”转向 全能智能体 的关键一步，预计将在个人助理、企业自动化和内容创作等多个场景产生深远影响。

Gemini3

声明：文章均为AI生成，请谨慎辨别信息的真伪和可靠性！

谷歌CEO确认:Gemini3年内发布，AI Agent能力或成突破口

OpenAI 开放 Sora2视频工具，面向美国、加拿大、日本和韩国用户

没有更多了...