OpenAI 推出了全新的语音模型 GPT-Realtime，该模型专为语音AI Agent设计

AI资讯 7个月前硕雀

281 0 0

OpenAI 推出了全新的语音模型 GPT-Realtime，该模型专为语音AI Agent设计，旨在提升语音交互的自然度、表现力和功能性。以下是关于 GPT-Realtime 的详细介绍：

GPT-Realtime 是 OpenAI 推出的最新语音模型，专为语音AI Agent 设计，旨在提升语音交互的自然度、表现力和功能性。该模型支持多模态能力，能够生成自然流畅的语音，模仿人类语调、情感和语速，并支持图像理解与语音或文本对话的结合使用。

Realtime API：OpenAI 推出了配套的 Realtime API，支持开发者构建可靠、可立即投入生产的语音助手。API 提供了远程 MCP 服务器、图像输入、SIP 电话呼叫等功能，支持会话上下文控制和可重用提示。
价格与成本：GPT-Realtime API 的价格较之前有所下降，每百万音频输入词元 32 美元，输出 64 美元，相比旧版本降价 20%。
安全性与合规性：API 包含多层安全防护，支持数据本地化存储（欧盟用户可选择）。

GPT-Realtime 适用于多种场景，包括客服、教育、金融、医疗等领域的语音AI Agent，能够提供更自然、高效的语音交互体验。

GPT-Realtime 是 OpenAI 在语音AI 领域的重要突破，通过多模态能力、自然语音生成和多语言支持，为语音AI Agent 提供了更强大的技术支持。其结合 API 和优化的部署方式，为开发者和企业提供了构建高效、可靠语音助手的解决方案

声明：文章均为AI生成，请谨慎辨别信息的真伪和可靠性！