Gemini 3 Flash登场：免费、极速、智力反超Pro

AI资讯 3个月前硕雀

114 0 0

Gemini 3 Flash 概览

1. 免费全局可用

Gemini 3 Flash 已被设为 Gemini App 的默认模型，取代原来的 2.5 Flash。所有 Gemini 用户（包括免费用户）在打开 App 后即可直接使用，无需额外付费或手动切换。
谷歌将其嵌入搜索 AI 模式，面向全球开放，真正实现“免费体验 Pro 级智商”。

2. 极速响应——速度提升 3 倍

基于 Artificial Analysis 的基准测试，Gemini 3 Flash 的推理速度比 Gemini 2.5 Pro 快约 3 倍，同时保持更低的延迟。
在同步和近实时场景下，付费 API 客户还能享受生产就绪的速率限制，适合需要即时反馈的交互式应用。

3. 智力超越 Pro——核心指标表现

评测	Gemini 3 Flash 得分	与 Pro 对比
SWE‑bench Verified（编码）‍	78 %	超过 2.5 Pro，甚至在部分任务上高于 Gemini 3 Pro
GPQA Diamond	90.4 %	接近或超过 Pro 级别
Humanity’s Last Exam	33.7 %	与 Pro 持平或更好
MMMU Pro	81.2 %	超越 2.5 Pro，逼近 Pro 表现
ARC‑AGI‑2	领先于 3 Pro

这些结果表明，Gemini 3 Flash 在多模态推理、代码生成、逻辑推理等方面的能力已经能够匹配甚至超越旗舰模型 Gemini 3 Pro。

4. 多模态与新功能

视觉/音频理解：能够快速解析图像、视频和音频，并在几秒内生成可执行的计划或测验，例如分析高尔夫挥杆、生成定制测验等。
代码执行：新增代码执行能力，可直接在视觉输入上进行计数、编辑等操作，提升开发者工作流效率。
上下文缓存：在重复使用相同上下文时可节省约 90 % 的 token 成本，进一步降低使用费用。

5. 超低成本

输入费用：每 1 百万 token 仅 0.50 美元。
输出费用：每 1 百万 token 3 美元。
音频输入：保持在每 1 百万 token 1 美元。
与 Gemini 3 Pro 相比，费用仅为其四分之一左右，且 token 消耗比 2.5 Pro 低约 30 %。

6. 典型使用场景

日常问答：在 Gemini App 中默认使用 Flash 模式，几秒内返回答案，适合聊天、信息检索等高频需求。
即时多模态交互：上传图片或音频后，模型快速生成文字摘要、计划或测验，适用于教育、内容创作等场景。
代码辅助：在 SWE‑bench 等基准上表现突出，可用于自动化编程、代码审查、Agent 开发等高价值任务。
企业 API：开发者可通过 Gemini API 调用 Flash，利用其高速低成本特性构建实时客服、智能助理等业务系统。

7. 市场意义

性价比优势：在性能、速度和成本三方面实现“不可兼得”的平衡，给 OpenAI、Anthropic 等竞争对手带来显著压力。
AI 基础设施：谷歌将 Flash 作为搜索 AI、全家桶的底座，标志着 AI 正从“稀缺资源”向“高频基础设施”转变。
推动行业创新：低门槛的高性能模型将加速智能体、自动化编程等新兴应用的落地，提升整体行业研发效率。

总结：Gemini 3 Flash 通过免费全局开放、3 倍速率提升、在多项关键基准上超越 Pro、以及极低的使用成本，构成了当前大模型领域的“高智+低价+快响应”三位一体的标杆产品。它不仅提升了普通用户的日常 AI 体验，也为开发者和企业提供了高效、经济的智能化解决方案。

Gemini 3 Flash

声明：文章均为AI生成，请谨慎辨别信息的真伪和可靠性！