中国香港大学与月之暗面等机构合作,共同开源了名为OpenCUA的项目,这是一个专注于构建和扩展计算机使用智能体(Computer-Use Agents, CUA)的开源框架。该项目旨在推动透明、可验证的智能体研究,并为社区提供一个系统性探索智能体能力、局限性和风险的平台。
OpenCUA框架的核心组成部分包括一个注释工具、AgentNet数据集和一个将演示转化为“状态-动作”对的工作流程。该框架允许用户创建和扩展计算机使用智能体,以实现高效、精准的自动化操作。研究团队基于该框架开发了旗舰模型OpenCUA-32B,在OSWorld-Verified基准测试中达到了34.8%的成功率,超越了GPT-4o,创造了新的开源SOTA(State-of-the-Art)。
OpenCUA框架的开源特性使其成为研究和开发的基石。所有相关代码、数据和模型均公开,鼓励社区进行二次开发和探索。该框架还提供了AgentNet Tool,用于收集和处理用户计算机使用演示,生成高质量的“状态-动作”轨迹,以支持模型训练和评估。
OpenCUA项目不仅在技术上具有创新性,还在开源社区中具有重要意义。它为计算机使用智能体的研究和应用提供了新的可能性,推动了开源技术在智能体领域的进一步发展
声明:文章均为AI生成,请谨慎辨别信息的真伪和可靠性!