阿里通义千问Qwen3-Max 在官网上线深度思考功能

AI资讯 8小时前 硕雀
1 0

阿里通义千问Qwen3‑Max 深度思考功能概览

内容 关键要点 参考来源
模型规模 参数量突破 1 万亿预训练数据约 36 T tokens,采用 MoEMixture‑of‑Experts)结构,实现高效大规模训练。
模型版本 Qwen3‑Max 包含 Base、Instruct、Thinking(深度思考)‍ 三个子模型,分别对应通用对话、指令遵循和强化推理能力。
深度思考(Thinking)模式 1. 强化推理链:模型在生成答案前会逐步展开推理链,显式记录每一步的思考过程。
2. 多步骤问题拆解:对复杂任务进行分解,先生成子问题或子任务,再逐一求解并汇总。
3. 可控思考预算:用户可在 UI 中开启/关闭思考模式,并设定思考长度(即推理步数),兼顾速度与质量。
4. 显著提升复杂任务效率:在 AIME 25、HMMT 等高难度数学推理基准上实现 100% 正确率,在代码、智能体等任务上也有明显提升。
使用方式 - 访问 Qwen Chat 官网https://chat.qwen.ai/ )或阿里云百炼平台。
- 在对话框左侧或设置页切换 “深度思考” 开关,或通过 API 参数 thinking=true 启用。
- 可通过 thinking_length(或类似字段)控制思考步数,适配不同算力预算。
性能表现 数学推理:在 AIME 25、HMMT 等基准全部满分。
代码生成:SWE‑Bench Verified 取得 69.6 分,显著优于同类模型。
多语言:支持 100+ 语言和方言,翻译、跨语言检索能力提升。
长上下文:支持 1 M token 长上下文,适合文档阅读、检索增强生成RAG)等场景。
典型应用场景 复杂数学/物理题目:逐步推导、证明过程展示。
软件开发:多步骤代码实现、调试思路说明。
商业报告/策划:分段分析需求、生成结构化方案。
多轮对话:在需要深度思考的对话中保持逻辑连贯性。
与普通模式的区别 普通(非思考)模式侧重 快速响应,适合简单查询;深度思考模式则在 推理深度、答案可靠性 上投入更多算力,响应时间相对更长。用户可根据任务需求自行切换。

小结

阿里通义千问 Qwen3‑Max 是截至 2025 年阿里云推出的规模最大、能力最强的语言模型。其 深度思考(Thinking)功能 通过强化推理链、分步拆解和可控思考预算,使模型在高难度数学、代码、智能体等复杂任务上实现了接近人类水平的准确率,同时保持了多语言和长上下文的优势。用户只需在官网或 API 中打开相应开关,即可根据实际需求在“快速响应”和“深度思考”之间灵活切换,满足从日常问答到专业推理的全链路需求。

来源:www.aiug.cn
声明:文章均为AI生成,请谨慎辨别信息的真伪和可靠性!