OpenAI 发布三款实时语音模型

资讯
6小时前
編輯

admin

5 月 8 日消息，今天，OpenAI 发布三款实时语音模型，分别针对语音推理、实时翻译和流式转录三类场景：

OpenAI 发布三款实时语音模型

GPT-Realtime-2：构建可用于生产环境的语音智能体。它们能够进行更深入的思考、执行操作、处理中断，并让对话持续自然地进行；

GPT-Realtime-Translate：支持 70 多种输入语言和 13 种输出语言的实时翻译，打破语言障碍，帮助人们更自然地交流；

GPT-Realtime-Whisper：实时转录音频流，生成字幕和注释。

其中，GPT-Realtime-2 搭载「GPT-5 级别的推理能力」，专为语音交互场景设计，能够在持续对话过程中处理复杂请求、多线程调用外部工具、应对用户中断，并保持对话的自然流畅。

三款模型均已通过 OpenAI Realtime API 向开发者开放，并可在 OpenAI Playground 中进行测试。

声明：内容来源公开的各类媒体平台，若收录的内容侵犯了您的权益，请联系邮箱，本站将第一时间处理。

{{userData.name}}已认证

OpenAI 发布三款实时语音模型

Inworld AI 发布 Realtime TTS-2 语音模型：可感知用户情绪，支持 100 种语言保持同一声线

Kimi 完成 20 亿美元融资，估值突破 200 亿美元

AI微博

AI应用

5000+AI应用！每日更新

1AICLUB

强烈推荐！官方品牌微博

AI教程

海量教程看不完

AI基础训练营

零基础入门，带你成为AI高手

1ai抖音

1ai大神

抖音号：1ai.net

1ai大神

抖音号：1ai.net

1ai微信

每天五分钟

一年变大神

扫码关注

{{userData.name}}已认证

相关内容：

Inworld AI 发布 Realtime TTS-2 语音模型：可感知用户情绪，支持 100 种语言保持同一声线

Kimi 完成 20 亿美元融资，估值突破 200 亿美元

OpenAI 发布新一代语音模型，让 AI 智能体语音表达更自然

苹果计划与 OpenAI 合作，加强 iPhone 人工智能功能

OpenAI ChatGPT 新增自动模式，基于提示词复杂度灵活选择合适 AI 模型

OpenAI 朝 AI 第 3 阶段迈进，正招募人才组建“多智能体”团队

AI应用

5000+AI应用！每日更新

1AICLUB

强烈推荐！官方品牌微博

AI教程

海量教程看不完

AI基础训练营

零基础入门，带你成为AI高手

1ai大神

抖音号：1ai.net

1ai大神

抖音号：1ai.net

每天五分钟

一年变大神

扫码关注