The new features could be handy for customer service systems, but OpenAI says they have applications that work across a ...
北京时间8月29日凌晨,OpenAI通过直播发布其迄今最先进的端对端语音模型(Speech-to-Speech)GPT-Realtime,并宣布Realtime ...
GPT-Realtime-2 专为实时交互设计,是首款具备 GPT-5 级推理能力的语音模型。它在保持对话自然流畅的前提下,能在对话过程中进行推理、调用工具,并处理用户的打断或纠正。这意味着开发者可以构建更复杂的语音助手,并能执行多步骤任务。
刚刚,OpenAI 放出了三个全新的实时语音模型,其中一个翻译模型,能把 70 多种语言实时翻译成 13 种语言输出,每分钟成本 2 毛钱。 GPT-Realtime-2,是 OpenAI 目前最强的语音模型,具备 GPT-5 级别的推理能力。它能边听边想,在对话中实时解决复杂问题。可以理解为:一个能打电话的 GPT-5。
OpenAI 公布了他们语音黑客松的四个入围项目,目前正在公开投票。 四个入围项目 这是 OpenAI 和 Cerebral Valley 在旧金山联合办的一场黑客松。5 月 27 日,在 OpenAI 总部,参与者带着自己的语音 Agent ...
【导读】绝杀!OpenAI发布GPT-Realtime-2:首个GPT-5级推理音频模型,OpenAI正式接管人类耳朵人类与机器的最后一道「防火墙」——键盘,正在彻底消失。 今天凌晨,OpenAI又给世界带来一次震撼。 这一次,他们不卷文字,不卷视频,而是要把那个曾让无数人惊艳、又让无数人遗憾的Samantha——电影《Her》中的AI——彻底带进现实。 OpenAI正式宣布,推出GPT-Real ...
OpenAI CEO 山姆·奥特曼,图片经由AI处理文丨苏扬编辑丨徐青阳 ...
OpenAI has introduced a new set of voice AI models capable of real-time reasoning, translation, and transcription, allowing ...
近日,OpenAI推出了三款面向实时语音场景的专用模型,并通过Realtime API向全球开发者开放调用。这三款模型分别聚焦于语音推理、多语言翻译和低延迟转录,旨在解决传统语音交互中的延迟响应、打断处理困难及跨语言支持不足等问题。 GPT-Realtime-2作为此次发布的旗舰产品,首次将GPT-5级别的推理能力引入语音交互领域。该模型在保持对话自然流畅的同时,支持实时推理决策、工具调用及用户打 ...
AI voice agents are getting closer to doing more than waiting their turn to speak. OpenAI announced Thursday that it is expanding its Realtime API with GPT-Realtime-2, a new voice ...
Global firms hire linguists, OpenAI debuts new models, LTPs adjust cloud compute strategies, and highlights from SlatorCon ...