| 内容 | 关键要点 | 参考来源 |
|---|---|---|
| 模型规模 | 参数量突破 1 万亿,预训练数据约 36 T tokens,采用 MoE(Mixture‑of‑Experts)结构,实现高效大规模训练。 | |
| 模型版本 | Qwen3‑Max 包含 Base、Instruct、Thinking(深度思考) 三个子模型,分别对应通用对话、指令遵循和强化推理能力。 | |
| 深度思考(Thinking)模式 | 1. 强化推理链:模型在生成答案前会逐步展开推理链,显式记录每一步的思考过程。 2. 多步骤问题拆解:对复杂任务进行分解,先生成子问题或子任务,再逐一求解并汇总。 3. 可控思考预算:用户可在 UI 中开启/关闭思考模式,并设定思考长度(即推理步数),兼顾速度与质量。 4. 显著提升复杂任务效率:在 AIME 25、HMMT 等高难度数学推理基准上实现 100% 正确率,在代码、智能体等任务上也有明显提升。 |
|
| 使用方式 | - 访问 Qwen Chat 官网(https://chat.qwen.ai/ )或阿里云百炼平台。 - 在对话框左侧或设置页切换 “深度思考” 开关,或通过 API 参数 thinking=true 启用。- 可通过 thinking_length(或类似字段)控制思考步数,适配不同算力预算。 |
|
| 性能表现 | - 数学推理:在 AIME 25、HMMT 等基准全部满分。 - 代码生成:SWE‑Bench Verified 取得 69.6 分,显著优于同类模型。 - 多语言:支持 100+ 语言和方言,翻译、跨语言检索能力提升。 - 长上下文:支持 1 M token 长上下文,适合文档阅读、检索增强生成(RAG)等场景。 |
|
| 典型应用场景 | - 复杂数学/物理题目:逐步推导、证明过程展示。 - 软件开发:多步骤代码实现、调试思路说明。 - 商业报告/策划:分段分析需求、生成结构化方案。 - 多轮对话:在需要深度思考的对话中保持逻辑连贯性。 |
|
| 与普通模式的区别 | 普通(非思考)模式侧重 快速响应,适合简单查询;深度思考模式则在 推理深度、答案可靠性 上投入更多算力,响应时间相对更长。用户可根据任务需求自行切换。 |
小结
阿里通义千问 Qwen3‑Max 是截至 2025 年阿里云推出的规模最大、能力最强的语言模型。其 深度思考(Thinking)功能 通过强化推理链、分步拆解和可控思考预算,使模型在高难度数学、代码、智能体等复杂任务上实现了接近人类水平的准确率,同时保持了多语言和长上下文的优势。用户只需在官网或 API 中打开相应开关,即可根据实际需求在“快速响应”和“深度思考”之间灵活切换,满足从日常问答到专业推理的全链路需求。
声明:文章均为AI生成,请谨慎辨别信息的真伪和可靠性!