Realtime API - 搜索 News

8 天

OpenAI 推出3款实时语音模型：会“思考”的语音、现场翻译与流式 ...

机场延误广播瞬间被手机 App 用母语解释并给出改签建议；会议中边说边看到中英字幕并自动生成要点。是什么技术让这些场景成为可能？答案是 OpenAI 于 2026 年 5 月在 Realtime API ...

腾讯网

刚刚，OpenAI放出三个语音模型，顺便杀死了“同传”

刚刚，OpenAI 放出了三个全新的实时语音模型，其中一个翻译模型，能把 70 多种语言实时翻译成 13 种语言输出，每分钟成本 2 毛钱。 GPT-Realtime-2，是 OpenAI 目前最强的语音模型，具备 GPT-5 ...

腾讯网

OpenAI工程师亲自修订：用ChatGPT实时语音API构建应用

OpenAI Realtime API 的「说明书」。 OpenAI 实时 API 的架构对话语音是 OpenAI 实时 API 支持的核心用例。对话语音 API 需要：管理多个用户和 LLM 轮次的对话状态；确定用户何时结束对话（并期待 LLM 的响应）；处理用户中断 LLM 输出；用户语音的文本转录、函数调用 ...

9 天

OpenAI 最智能 AI 语音模型：GPT-Realtime-2 登场，GPT-5 级推理能力

GPT-Realtime-2 专为实时交互设计，是首款具备 GPT-5 级推理能力的语音模型。它在保持对话自然流畅的前提下，能在对话过程中进行推理、调用工具，并处理用户的打断或纠正。这意味着开发者可以构建更复杂的语音助手，并能执行多步骤任务。

8 天

OpenAI让模型“张嘴”，你要注意：辱骂AI，很贵的

5月8日，OpenAI在API中加入三款新一代语音模型：主打语音推理与对话的GPT‑Realtime‑2、突出实时多语言翻译的Realtime‑Translate以及聚焦语音转文本的Realtime‑Whisper。

9 天

AI有嘴了，OpenAI 连发三语音模型

昨天凌晨，OpenAI发布了三款音频模型：GPT-Realtime-2、GPT-Realtime-Translate和GPT-Realtime-Whisper。

投资界

MiniMax Realtime API 亮相 RTE 2024实时互联网大会，系国内首个Realtime API

10月25日，RTE 2024 第十届实时互联网大会正式开幕。本次大会由声网和RTE开发者社区联合主办，以“AI 爱”为主题，推出覆盖实时互联网全生态的论坛及周边活动共计20余场。声网创始人兼CEO赵斌在主论坛以《实时互动十年：从Web RTC到生成式AI时代的RTE》为题作 ...

8 天on MSN

OpenAI发布三款实时语音模型：GPT-Realtime-2领衔，推理翻译转录全升级

OpenAI 近日正式推出三款针对实时语音场景优化的全新模型，通过 Realtime API 向全球开发者开放调用。这三款模型分别聚焦推理交互、多语言翻译和低延迟转录三大核心需求，旨在破解传统语音技术中存在的延迟响应、打断处理困难及多语言支持不足等痛点，为智能语音助手、实时会议系统等应用提供底层技术支撑。

凤凰网

OpenAI发布Realtime API，助力第三方应用集成其语音合成技术

IT之家 10 月 2 日消息，科技媒体 The Decoder 昨日（10 月 1 日）发布博文，报道称 OpenAI 在旧金山开发者大会（DevDay）上，发布了 Realtime API，可以让开发者调用该 API 在第三方应用中集成语音合成技术。 OpenAI 表示开发者通过调用新的 Realtime API，可以在其应用中添加 ...

8 天on MSN

OpenAI发布三款实时语音模型：GPT-Realtime-2推理强，翻译转录也高效

OpenAI 近日推出三款面向实时语音场景的专用模型，通过Realtime API向全球开发者开放调用。这三款模型分别聚焦语音推理、多语言翻译和低延迟转录三大核心需求，旨在破解传统语音交互中存在的延迟响应、打断处理困难及跨语言支持不足等痛点，为智能语音助手、实时会议系统等应用提供底层技术支撑。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果