Gemini 3 Flash登场:免费、极速、智力反超Pro

AI资讯 7小时前 硕雀
6 0

Gemini 3 Flash 概览


1. 免费全局可用

  • Gemini 3 Flash 已被设为 Gemini App 的默认模型,取代原来的 2.5 Flash。所有 Gemini 用户(包括免费用户)在打开 App 后即可直接使用,无需额外付费或手动切换。
  • 谷歌将其嵌入搜索 AI 模式,面向全球开放,真正实现“免费体验 Pro 级智商”。

2. 极速响应——速度提升 3 倍

  • 基于 Artificial Analysis 的基准测试,Gemini 3 Flash 的推理速度比 Gemini 2.5 Pro 快约 3 倍,同时保持更低的延迟。
  • 在同步和近实时场景下,付费 API 客户还能享受生产就绪的速率限制,适合需要即时反馈的交互式应用。

3. 智力超越 Pro——核心指标表现

评测 Gemini 3 Flash 得分 与 Pro 对比
SWE‑bench Verified(编码) 78 % 超过 2.5 Pro,甚至在部分任务上高于 Gemini 3 Pro
GPQA Diamond 90.4 % 接近或超过 Pro 级别
Humanity’s Last Exam 33.7 % 与 Pro 持平或更好
MMMU Pro 81.2 % 超越 2.5 Pro,逼近 Pro 表现
ARC‑AGI‑2 领先于 3 Pro

这些结果表明,Gemini 3 Flash 在多模态推理、代码生成、逻辑推理等方面的能力已经能够匹配甚至超越旗舰模型 Gemini 3 Pro。

4. 多模态与新功能

  • 视觉/音频理解:能够快速解析图像、视频和音频,并在几秒内生成可执行的计划或测验,例如分析高尔夫挥杆、生成定制测验等。
  • 代码执行:新增代码执行能力,可直接在视觉输入上进行计数、编辑等操作,提升开发者工作流效率。
  • 上下文缓存:在重复使用相同上下文时可节省约 90 % 的 token 成本,进一步降低使用费用。

5. 超低成本

  • 输入费用:每 1 百万 token 仅 0.50 美元。
  • 输出费用:每 1 百万 token 3 美元。
  • 音频输入:保持在每 1 百万 token 1 美元。
  • 与 Gemini 3 Pro 相比,费用仅为其四分之一左右,且 token 消耗比 2.5 Pro 低约 30 %。

6. 典型使用场景

  1. 日常问答:在 Gemini App 中默认使用 Flash 模式,几秒内返回答案,适合聊天、信息检索等高频需求。
  2. 即时多模态交互:上传图片或音频后,模型快速生成文字摘要、计划或测验,适用于教育、内容创作等场景。
  3. 代码辅助:在 SWE‑bench 等基准上表现突出,可用于自动化编程、代码审查、Agent 开发等高价值任务。
  4. 企业 API:开发者可通过 Gemini API 调用 Flash,利用其高速低成本特性构建实时客服、智能助理等业务系统。

7. 市场意义

  • 性价比优势:在性能、速度和成本三方面实现“不可兼得”的平衡,给 OpenAIAnthropic 等竞争对手带来显著压力。
  • AI 基础设施:谷歌将 Flash 作为搜索 AI、全家桶的底座,标志着 AI 正从“稀缺资源”向“高频基础设施”转变。
  • 推动行业创新:低门槛的高性能模型将加速智能体、自动化编程等新兴应用的落地,提升整体行业研发效率。

总结:Gemini 3 Flash 通过免费全局开放、3 倍速率提升、在多项关键基准上超越 Pro、以及极低的使用成本,构成了当前大模型领域的“高智+低价+快响应”三位一体的标杆产品。它不仅提升了普通用户的日常 AI 体验,也为开发者和企业提供了高效、经济的智能化解决方案。

来源:www.aiug.cn
声明:文章均为AI生成,请谨慎辨别信息的真伪和可靠性!