腾讯于2025年7月27日在上海世界人工智能大会上正式发布了其首个开源的3D世界生成模型——混元3D世界模型1.0。这一模型的发布标志着腾讯在人工智能和3D技术领域的一次重大突破,为游戏开发、虚拟现实(VR)、数字内容创作等多个领域带来了前所未有的可能性。
核心技术与创新点
混元3D世界模型1.0融合了全景视觉生成与分层3D重建技术,能够通过简单的文字或图片输入,快速生成高质量、风格多样的可漫游3D场景。其核心在于创新的「语意层次化3D场景表征及生成算法」,该算法将复杂的3D世界解构为不同的语意层级,实现前景与背景、地面与天空的智能分离,从而生成视觉效果逼真的整体场景。
应用场景与优势
对于游戏开发者而言,混元3D世界模型极大简化了3D场景构建流程。过去,构建一个完整的3D虚拟世界往往需要专业的建模团队数周的努力,而现在,通过混元3D,开发者只需简单指令,模型便可迅速生成包含建筑、地形和植被的完整场景。生成的Mesh文件可直接用于游戏原型搭建或关卡设计,支持灵活调整前景物体或更换天空背景,满足个性化创作需求。
此外,混元3D世界模型1.0不仅能够生成高质量的3D场景,还能输出标准化的3D Mesh资产,这些资产与Unity、Unreal Engine、Blender等主流工具完美兼容,确保了与现有开发流程的无缝衔接。用户还可以对场景内的元素进行独立编辑或物理仿真,进一步拓展了AIGC技术的应用范围。
开源计划与生态建设
腾讯混元3D世界模型1.0的发布,是腾讯在开源策略上的又一重要举措。除了3D模型外,腾讯还披露了一系列开源计划,包括端侧混合推理语言模型、多模态理解模型、游戏视觉模型等。这些计划的推出将进一步推动人工智能技术在各个领域的应用,尤其是在游戏和数字内容创作方面。
腾讯正在逐步构建一个完善的3D内容生成生态,推动游戏开发和虚拟现实等领域的创新与发展。全球首个AI设计智能体Lovart已首选调用混元3D模型的API接口,知名3D打印公司拓竹科技旗下的模型平台MakerWorld也已接入混元3D模型。这一系列举措不仅展示了腾讯在技术创新上的领先地位,也为全球开发者提供了一个强大的工具,使他们能够在创作上突破想象的界限。
未来展望
随着混元3D世界模型1.0的发布,腾讯正在开启一个全新的虚拟世界构建时代。这一技术的普及将使未来的数字内容创作更加丰富多彩,虚拟世界的探索将更加深入人心。腾讯将继续引领3D技术的发展,推动整个行业向更高的水平迈进