智谱AI全新开源模型 GLM‑4.7 概览
1. 发布背景与定位
- 发布时间:2025 年 12 月 23 日,正值公司即将 IPO 的关键节点,智谱 AI 同步上线并开源了旗舰模型 GLM‑4.7。
- 核心定位:在 编码(Coding)、长程任务规划 与 工具协同 三大场景实现深度强化,旨在打造兼具高质量代码生成、复杂任务推理和多模态协作的全能大模型。
2. 技术特性
| 维度 | 关键改进 | 说明 |
|---|---|---|
| 模型架构 | 采用混合专家(MoE)与高效激活机制,激活参数仅为总参数的约 10%‑12%,兼顾算力与性能。 | |
| 参数规模 | 总参数约 3550 亿(GLM‑4.7‑Air 约 1060 亿),激活参数分别为 320 亿 / 120 亿,保持与前代模型相近的算力基准,同时显著提升推理效率。 | |
| 长上下文 | 支持 128 K token 以上的超长文本输入,单次提示可处理 300 页文档,满足复杂代码审查与文档生成需求。 | |
| 多模态与工具协同 | 在 z.ai 平台推出 Skills 模块,实现多模态任务统一规划、工具调用链路自动化,支持“先思考、再行动”的工作流。 | |
| 编码能力 | 专为 Coding 场景 加强,支持多语言代码生成、代码修改、终端智能体操作;在 Claude Code、TRAE、Kilo Code、Cline、Roo Code 等框架中实现“先思考、再行动”机制,提升复杂任务的稳定性。 | |
| 前端与审美 | 前端生成质量显著提升,能够输出更具观感的网页、PPT、海报等视觉内容。 |
3. 关键性能评测(公开基准)
| 基准 | 结果 | 说明 |
|---|---|---|
| CodeArena(全球专业编码评估) | 开源模型第一、国产模型第一,超越 GPT‑5.2。 | |
| SWE‑bench‑Verified、LiveCodeBenchV6 | 均取得 开源 SOTA 分数,与 Claude Sonnet 4.5 持平。 | |
| AIME 2025(高级数学推理) | 正确率 95.7%,刷新公开 SOTA。 | |
| BrowseComp‑ZH | 分数 66.6,居同类模型前列。 | |
| 其他 17 项基准(包括真实代码修改、终端操作、多工具调用、长链路任务) | 与 GPT‑5、Claude Sonnet 4.5、Gemini 3.0 Pro、DeepSeek‑V3.2、Kimi K2 Thinking 等同台竞技,整体表现领先。 |
4. 生态与服务
- API 接入:通过 BigModel.cn 提供统一 API,支持高并发、低成本调用(输入 0.8 元/百万 tokens,输出 2 元/百万 tokens)。
- 全栈开发模式:在 z.ai 平台上线全新 Skills 模块,支持多模态任务统一规划与协作执行,进一步降低开发者集成门槛。
- 开源许可证:模型权重遵循 MIT License,在 Hugging Face 与 ModelScope 同步开源,便于社区二次开发与生态共建。
5. 竞争意义
- 国产大模型的里程碑:GLM‑4.7 在多项公开基准上实现 开源 SOTA,标志着国产模型在编码与智能体能力上已接近甚至超越国际领先模型。
- 技术路线的差异化:通过 MoE 高效激活 与 工具协同思考框架,在算力成本与实际业务落地之间取得更佳平衡,为企业级 AI 应用提供更具性价比的解决方案。
- 生态驱动:结合 API、Skills 模块、开源社区,形成从模型研发到产品落地的闭环,提升了智谱 AI 在国内外 AI 产业链中的竞争力。
6. 小结
GLM‑4.7 是智谱 AI 在 编码、长程推理与工具协同 三大核心能力上的一次重要跃升。它通过 混合专家架构、超长上下文、全新 Skills 模块 等技术创新,实现了在 CodeArena、SWE‑bench、AIME 等权威基准 上的领先表现,并以 开放 API、MIT 许可证 的方式快速向开发者与企业开放,进一步巩固了国产大模型在全球 AI 竞争格局中的地位。
声明:文章均为AI生成,请谨慎辨别信息的真伪和可靠性!