百度发布全新多模态 AI 助手 “超能小度”

百度全新多模态 AI 助手 “超能小度”概览

维度 关键内容 说明
发布背景 2025 年 11 月 13 日,百度世界大会“大模型如何重塑智能硬件新体验”分论坛上正式发布。
定位升级 从传统语音助手升级为 AI 伙伴,实现 语音 + 视觉 + 空间感知 的多模态交互,能够更全面地理解用户意图和真实环境。
技术核心 - 基于 AI 原生操作系统,具备更强的视觉理解、推理与空间感知能力。
- 采用自研 极速架构,显著提升响应速度。
主要功能 1. AI 会议纪要:实时转写、要点提取。
2. AI 识物 & 翻译:拍照即识别并提供多语言翻译。
3. 智能寻物:通过语音指令记录并查询物品或位置(如停车位)。
4. 健康监护 & 氛围歌单:根据环境与用户状态提供音乐、健康提醒。
硬件生态 已集成至多款小度硬件:
小度 AI 眼镜 Pro
小度智能摄像机 C1200(三摄版)‍、C800(视频通话版)
小度智能音箱 Fun 等。
全系、全量、全生态同步上线。
升级方式 数千万台已售出的小度设备可 免费升级 超能小度,用户只需通过小度 APP 更新即可享受新功能。
行业意义 超能小度的多模态能力实现了 AI 助手向 AI 伙伴 的进化,提升了智能硬件在家庭、办公、公共场景的实用价值,也为行业提供了开放平台,推动千行百业的 AI 化升级。

详细介绍

  1. 多模态交互能力
    超能小度不再局限于“听会说”,它能够通过摄像头捕捉视觉信息、结合空间环境感知,形成对现实世界的整体理解。例如,在停车场只需说“帮我记一下”,系统会自动拍照、识别车位并生成备忘,随后可随时查询“我的车停在哪”。
  2. AI 原生操作系统与极速响应
    采用自研的 AI 原生操作系统,内部集成了视觉理解、推理模型和空间感知模块,使得设备在处理多模态输入时保持高效。极速架构的引入,使得从语音指令到结果返回的时延大幅降低,提升用户体验
  3. 核心功能场景
    • 会议纪要:在会议中直接对设备说“记录会议”,系统实时转写并提炼要点。
    • 识物翻译:拍摄物体后即可得到名称、属性及多语言翻译,适用于旅行、学习等场景。
    • 智能提醒与寻物:通过语音记录日常事务(如“明天几点会停水”),系统自动关联时间、地点并在需要时主动提醒。
    • 健康与娱乐:根据用户的情绪或环境自动播放合适的音乐,提供健康监测建议。
  4. 硬件覆盖与免费升级
    超能小度已预装在最新发布的 小度 AI 眼镜 Pro小度智能摄像机 C1200C800 以及 小度智能音箱 Fun 中。同时,已有的数千万台小度设备(包括早期的音箱、摄像机等)均可通过小度 APP 免费升级,用户无需额外费用即可体验全新多模态交互。
  5. 生态与开放平台
    超能小度通过开放 API,向第三方开发者提供多模态能力的接入,帮助企业在智能客服、智慧零售、教育培训等领域快速构建 AI 解决方案,推动行业数字化转型。

小结

超能小度是百度在 AI 助手领域的最新里程碑,凭借多模态感知、AI 原生系统和极速响应,实现了从“语音助手”向“AI 伙伴”的跨越。它不仅提升了用户在日常生活中的交互体验,也为智能硬件生态注入了更强的技术竞争力,预计将在家庭、办公、公共服务等多个场景产生深远影响。

来源:www.aiug.cn
声明:文章均为AI生成,请谨慎辨别信息的真伪和可靠性!