百度全新多模态 AI 助手 “超能小度”概览
| 维度 | 关键内容 | 说明 |
|---|---|---|
| 发布背景 | 2025 年 11 月 13 日,百度世界大会“大模型如何重塑智能硬件新体验”分论坛上正式发布。 | |
| 定位升级 | 从传统语音助手升级为 AI 伙伴,实现 语音 + 视觉 + 空间感知 的多模态交互,能够更全面地理解用户意图和真实环境。 | |
| 技术核心 | - 基于 AI 原生操作系统,具备更强的视觉理解、推理与空间感知能力。 - 采用自研 极速架构,显著提升响应速度。 |
|
| 主要功能 | 1. AI 会议纪要:实时转写、要点提取。 2. AI 识物 & 翻译:拍照即识别并提供多语言翻译。 3. 智能寻物:通过语音指令记录并查询物品或位置(如停车位)。 4. 健康监护 & 氛围歌单:根据环境与用户状态提供音乐、健康提醒。 |
|
| 硬件生态 | 已集成至多款小度硬件: - 小度 AI 眼镜 Pro - 小度智能摄像机 C1200(三摄版)、C800(视频通话版) - 小度智能音箱 Fun 等。 全系、全量、全生态同步上线。 |
|
| 升级方式 | 数千万台已售出的小度设备可 免费升级 超能小度,用户只需通过小度 APP 更新即可享受新功能。 | |
| 行业意义 | 超能小度的多模态能力实现了 AI 助手向 AI 伙伴 的进化,提升了智能硬件在家庭、办公、公共场景的实用价值,也为行业提供了开放平台,推动千行百业的 AI 化升级。 |
详细介绍
- 多模态交互能力
超能小度不再局限于“听会说”,它能够通过摄像头捕捉视觉信息、结合空间环境感知,形成对现实世界的整体理解。例如,在停车场只需说“帮我记一下”,系统会自动拍照、识别车位并生成备忘,随后可随时查询“我的车停在哪”。 - AI 原生操作系统与极速响应
采用自研的 AI 原生操作系统,内部集成了视觉理解、推理模型和空间感知模块,使得设备在处理多模态输入时保持高效。极速架构的引入,使得从语音指令到结果返回的时延大幅降低,提升用户体验。 - 核心功能场景
- 会议纪要:在会议中直接对设备说“记录会议”,系统实时转写并提炼要点。
- 识物翻译:拍摄物体后即可得到名称、属性及多语言翻译,适用于旅行、学习等场景。
- 智能提醒与寻物:通过语音记录日常事务(如“明天几点会停水”),系统自动关联时间、地点并在需要时主动提醒。
- 健康与娱乐:根据用户的情绪或环境自动播放合适的音乐,提供健康监测建议。
- 硬件覆盖与免费升级
超能小度已预装在最新发布的 小度 AI 眼镜 Pro、小度智能摄像机 C1200、C800 以及 小度智能音箱 Fun 中。同时,已有的数千万台小度设备(包括早期的音箱、摄像机等)均可通过小度 APP 免费升级,用户无需额外费用即可体验全新多模态交互。 - 生态与开放平台
超能小度通过开放 API,向第三方开发者提供多模态能力的接入,帮助企业在智能客服、智慧零售、教育培训等领域快速构建 AI 解决方案,推动行业数字化转型。
小结
超能小度是百度在 AI 助手领域的最新里程碑,凭借多模态感知、AI 原生系统和极速响应,实现了从“语音助手”向“AI 伙伴”的跨越。它不仅提升了用户在日常生活中的交互体验,也为智能硬件生态注入了更强的技术竞争力,预计将在家庭、办公、公共服务等多个场景产生深远影响。
声明:文章均为AI生成,请谨慎辨别信息的真伪和可靠性!