阿里正式发布千问旗舰推理模型Qwen3-Max-Thinking

AI资讯 2个月前硕雀

50 0 0

阿里巴巴（Alibaba）于 2026年1月26日 正式发布了千问系列的最新旗舰推理模型 Qwen3-Max-Thinking。该模型是阿里通义千问（Qwen）系列的最新力作，专注于深度推理（Thinking）能力，旨在解决复杂数学、科学计算和代码编程等高阶任务。

以下是关于该模型的详细介绍：

Qwen3-Max-Thinking 是目前阿里规模最大、能力最强的推理模型，具有以下核心创新：

深度推理能力：
- 专注于复杂任务和长链推理，支持模型内部的“深思熟虑”过程。
- 在数学推理基准（如 AIME25、HMMT25）中表现突出，能够处理需要多步骤思考的任务。
自适应工具调用能力：
- 集成了强大的工具调用体系，能够根据需求动态调用搜索引擎、代码解释器等工具。
- 已经上线至阿里千问 AI 助手（Qwen Chat），用户可以在 PC 端和网页端直接体验。
测试时扩展技术 (Test-Time Scaling)：
- 引入了“测试时扩展”技术，通过在推理阶段动态调整计算资源，有效提升推理性能。
- 在关键推理基准上，性能超越了 Gemini 3 Pro 等国际顶尖模型。

总参数量：该模型的参数量超过 1 万亿（1T），是当前千问系列中规模最大的一款模型。
预训练数据：
- 该模型使用了高达 36 万亿 Tokens 的预训练数据，覆盖了多种语言和领域。
- 采用了先进的混合注意力机制和高稀疏度 MoE（Mixture of Experts）架构，在强化学习训练中实现了高效稳定性。

模型家族：
- Qwen3-Max-Thinking 是 Qwen3 系列的一部分，除了推理版本（Thinking），阿里还发布了指令版本（Instruction）和视觉语言处理版本（Qwen3-VL）。
应用集成：
- 除了作为独立的大模型 API，Qwen3-Max-Thinking 已经同步接入了阿里千问的对话系统（Qwen Chat）。
- 用户在使用千问 AI 助手时，只需在模型选择栏切换，即可体验其强大的推理能力。

根据阿里公布的数据，Qwen3-Max-Thinking 在 19 项权威基准测试中表现出色：

媲美国际顶尖模型：其性能已达到 OpenAI 的 GPT-5.2-Thinking、谷歌的 Gemini 3 Pro、Anthropic 的 Claude Opus 4.5 等国际顶尖模型的水平。
刷新纪录：在科学知识（GPQA Diamond）、数学推理（IMO-AnswerBench）和代码编程（LiveCodeBench）等基准测试中，刷新了全球纪录。

5. 体验地址：

Qwen Chat：https://chat.qwen.ai/

百炼API：https://bailian.console.aliyun.com/cn-beijing/?tab=model#/model-market/detail/qwen3-max-2026-01-23

千问APP网页版：https://www.qianwen.com/

Qwen3-Max-Thinking 的发布标志着国产大模型在高阶推理领域实现了重要突破。它不仅在参数规模上达到了万亿级别，更通过引入“深度思考”模式和自适应工具调用，解决了大模型在处理复杂数学计算和代码逻辑时的瓶颈，是阿里通义千问系列迈向通用人工智能（AGI）的关键一步。

声明：文章均为AI生成，请谨慎辨别信息的真伪和可靠性！