阿里通义千问Qwen3-Max 在官网上线深度思考功能

AI资讯 5个月前硕雀

119 0 0

内容	关键要点	参考来源
模型规模	参数量突破 1 万亿，预训练数据约 36 T tokens，采用 MoE（Mixture‑of‑Experts）结构，实现高效大规模训练。
模型版本	Qwen3‑Max 包含 Base、Instruct、Thinking（深度思考）‍ 三个子模型，分别对应通用对话、指令遵循和强化推理能力。
深度思考（Thinking）模式	1. 强化推理链：模型在生成答案前会逐步展开推理链，显式记录每一步的思考过程。 2. 多步骤问题拆解：对复杂任务进行分解，先生成子问题或子任务，再逐一求解并汇总。 3. 可控思考预算：用户可在 UI 中开启/关闭思考模式，并设定思考长度（即推理步数），兼顾速度与质量。 4. 显著提升复杂任务效率：在 AIME 25、HMMT 等高难度数学推理基准上实现 100% 正确率，在代码、智能体等任务上也有明显提升。
使用方式	- 访问 Qwen Chat 官网（https://chat.qwen.ai/ ）或阿里云百炼平台。 - 在对话框左侧或设置页切换 “深度思考” 开关，或通过 API 参数 `thinking=true` 启用。 - 可通过 `thinking_length`（或类似字段）控制思考步数，适配不同算力预算。
性能表现	- 数学推理：在 AIME 25、HMMT 等基准全部满分。 - 代码生成：SWE‑Bench Verified 取得 69.6 分，显著优于同类模型。 - 多语言：支持 100+ 语言和方言，翻译、跨语言检索能力提升。 - 长上下文：支持 1 M token 长上下文，适合文档阅读、检索增强生成（RAG）等场景。
典型应用场景	- 复杂数学/物理题目：逐步推导、证明过程展示。 - 软件开发：多步骤代码实现、调试思路说明。 - 商业报告/策划：分段分析需求、生成结构化方案。 - 多轮对话：在需要深度思考的对话中保持逻辑连贯性。
与普通模式的区别	普通（非思考）模式侧重快速响应，适合简单查询；深度思考模式则在推理深度、答案可靠性上投入更多算力，响应时间相对更长。用户可根据任务需求自行切换。

小结

阿里通义千问 Qwen3‑Max 是截至 2025 年阿里云推出的规模最大、能力最强的语言模型。其 深度思考（Thinking）功能 通过强化推理链、分步拆解和可控思考预算，使模型在高难度数学、代码、智能体等复杂任务上实现了接近人类水平的准确率，同时保持了多语言和长上下文的优势。用户只需在官网或 API 中打开相应开关，即可根据实际需求在“快速响应”和“深度思考”之间灵活切换，满足从日常问答到专业推理的全链路需求。

Qwen3‑Max

声明：文章均为AI生成，请谨慎辨别信息的真伪和可靠性！

阿里通义千问Qwen3-Max 在官网上线深度思考功能

小结

TikTok推AI剪辑新工具“Smart Split”

OpenAI 开放 Sora2视频工具，面向美国、加拿大、日本和韩国用户