腾讯混元 2.0(Tencent HY 2.0)概览
- 模型架构:采用混合专家(Mixture‑of‑Experts,MoE)结构,整体参数 406 B,激活参数 32 B,支持 256 K 超长上下文窗口。
- 两大版本:
- 核心能力:
内测开启时间与渠道
- 视频生成能力内测
- 图像生成 2.0 内测
- 开放时间:2025 年 5 月 16 日,混元 Image 2.0 在官方站点上线并对外开放注册体验。
- 使用入口:腾讯混元官网、元宝 App 以及 iMA 智能工作台 均提供实时绘画板与多轮图像生成功能,用户可通过账号登录即刻使用。
内测对象与资格
- 企业客户:主要面向已在腾讯云签约的企业用户,需在云控制台完成 API 内测申请后方可调用。
- 个人用户:通过元宝 App 提交试用申请即可获得体验资格,暂无额度限制,但仅限在 App 内使用,不提供独立 API 调用权限。
内测期间的主要功能亮点
| 功能 | 说明 | 关键技术 |
|---|---|---|
| 文生视频 | 中英双语输入,生成 7 K 分辨率、毫秒级响应的视频;支持多视角、光影真实感 | 130 B 参数的 DiT‑style 视频生成模型,已在 Hugging Face 与 GitHub 开源 |
| 实时生图 | 毫秒级出图,支持边绘边生成、线稿上色、多人图融合 | 超高压缩倍率的图像编解码器 + 强化学习对齐 |
| 长上下文推理 | 256 K token 上下文,适用于长文档摘要、代码审查等 | MoE 结构的激活路由机制 |
| 多模态指令遵循 | 同时处理文本、图片、音频指令,支持“一句话生成图片+视频” | 多模态统一编码器 + 重要性采样校正 |
内测报名与使用流程
- 元宝 App:打开 App → “AI 视频” → “申请试用”。提交后系统自动分配试用额度,用户即可在对话框中输入文字或上传素材生成视频。
- 腾讯云 API:登录腾讯云 → “AI 大模型” → “混元 Turbo / HY 2.0” → “内测申请”。填写企业信息、使用场景后提交,审核通过后获取 API Key 与 Endpoint,即可在代码中调用(REST / gRPC)。
- 官网注册:访问 https://hunyuan.tencent.com → “注册体验”,使用企业邮箱完成实名认证后即可进入模型实验室,体验图像、文本、代码等多模态功能。
与前代(Hunyuan‑T1)对比
- 规模提升:参数从约 130 B(T1)提升至 406 B(HY 2.0),激活参数从 16 B 增至 32 B。
- 推理效率:MoE 结构使同等算力下推理速度提升约 2‑3 倍,成本下降约 50 %(官方报价 0.05 元/千 tokens)。
- 上下文长度:从 32 K 扩展至 256 K,显著提升长文档处理能力。
- 多模态能力:新增文生视频、实时生图、跨语言(中英)支持,覆盖文本、图像、视频三大模态。
内测意义
- 为企业提供 AI 视频生成 与 高效长文本推理 的落地场景(如会议纪要自动生成、广告创意视频、游戏 CG 预览等)。
- 通过 API 内测 收集真实业务负载与反馈,帮助腾讯进一步优化模型压缩、成本控制与安全审计。
- 让 个人用户 在元宝 App 中提前体验最新的毫秒级交互式生成能力,提升产品黏性并培养生态用户。
后续计划(已公开)
- 继续开放 混元 Turbo(已在 9 月发布)更高效的 MoE 版本,降低使用门槛。
- 计划在 2025 年 Q1 将视频生成模型全部开源至 Hugging Face 与 GitHub,供开发者二次创新。
- 将模型能力进一步扩展至 音频生成 与 跨语言检索,形成完整的多模态大模型生态。
综上,腾讯混元 2.0 的内测已在 2025 年 12 月 3 日通过元宝 App 与腾讯云 API 双渠道向个人与企业用户开放,提供包括文生视频、实时生图、超长上下文推理等多项领先功能,标志着腾讯在大模型商业化与多模态生成领域进入全新阶段。
声明:文章均为AI生成,请谨慎辨别信息的真伪和可靠性!