1. 模型背景与目标
ABot-M0 是由高德发布的全球首个基于统一架构的具身机器人通用基座模型。它旨在解决机器人智能化发展过程中的“数据孤岛”和“部署难点”问题。通过构建一个适配多种形态的“通用大脑”,ABot-M0 能够实现“一套模型驱动多种机器人”,从而突破当前机器人技术多为单一场景或专用解决方案的局限性。
2. 技术架构与创新
ABot-M0 的技术体系主要围绕“空间感知”和“动作生成”两个核心维度展开,具备以下创新点:
- 统一架构(Unified Architecture)
高德通过构建统一的动作表示、坐标系与控制频率,实现了跨平台的数据融合和模型通用性。这种统一架构验证了“一个大脑驱动多种形态”的可行性,为“通用大脑+专用躯体”的产业标准奠定了基础。 - 动作流形学习(AML)算法
在算法层面,ABot-M0 引入了动作流形学习(AML)算法。该算法通过直接预测可执行的动作序列,显著减少了机器人在实际操作中的试错过程,提高了执行效率和安全性。 - 双流感知架构
ABot-M0 采用了双流感知架构(Dual-Stream Perception),结合了视觉语言模型(VLM)和三维空间模块。这使得模型在具备强大语义理解能力的同时,也拥有精准的三维空间感知能力,从而能够更好地理解和操作真实世界的环境。
3. 数据集与规模
ABot-M0 的成功离不开其庞大的数据支撑。高德为其构建了目前规模最大的通用机器人数据集 UniACT。
- UniACT 数据集
该数据集整合了超过 600 万条 真实操作轨迹,涵盖了从原始异构数据到标准化训练数据的全流程处理管线。通过增量式动作建模和统一的坐标系设计,UniACT 支持跨平台的数据融合,为模型的预训练提供了坚实的基础。
4. 性能表现(Benchmark Results)
ABot-M0 在多个权威基准测试中表现出色,验证了其通用性和强大的空间理解能力:
- Libero-Plus 基准测试
在该基准测试中,ABot-M0 的任务成功率达到了 80.5%,较业界此前的标杆方案 Pi0 提升了近 30 个百分点。这证明了它在复杂环境、布局变化和噪声干扰等场景下的强大泛化能力。 - 其他基准测试
除了 Libero-Plus,ABot-M0 在 Libero、RoboCasa 等多个国际标准测评集上也均实现了最优表现,特别是在空间理解与任务执行能力方面表现亮眼。
5. 开源内容与意义
ABot-M0 的开源涵盖了数据、算法与模型三个维度,这在具身智能领域具有里程碑意义:
- 全栈开源
开源内容包括了原始的 UniACT 数据集、创新的 AML 算法、完整的模型架构与训练框架、以及端到端的预训练模型和完整工具链。 - 易用性
开源的工具链和模型能够让开发者无需从零搭建训练框架,即可快速适配工业、家庭等不同场景,真正实现“开箱即用”。 - 社区影响
高德表示,ABot-M0 的开源标志着高德实质性参与到了全球具身智能社区的发展中,旨在通过开源促进学术研究与产业应用的深度结合,让每一台机器人都能拥有通用且可靠的“智能大脑”。
总结
ABot-M0 通过 UniACT 数据集 的规模化、AML 算法 的高效性以及 统一架构 的通用性,突破了具身智能的传统局限。它不仅在多个权威基准测试中达到了 SOTA(State Of The Art)的水平,更通过全量开源,为全球的机器人研究者和开发者提供了一个强大的通用技术基座,极大地降低了开发门槛并推动了具身智能技术的标准化进程。
声明:文章均为AI生成,请谨慎辨别信息的真伪和可靠性!