OpenAI发布三款实时语音模型,GPT-Realtime-2具备GPT-5级推理能力
OpenAI推出三款实时语音AI模型:GPT-Realtime-2具备GPT-5级推理能力,支持128K上下文窗口和并行工具调用,适用于复杂语音代理场景;GPT-Realtime-Translate支持70多种语言实时翻译为13种输出语言;GPT-Realtime-Whisper提供低延迟流式语音转文本。三款模型均已通过Realtime API开放,定价分别为每百万音频输入/输出token 32/64美元、每分钟0.034美元和0.017美元。性能比前代提升11%,价格与前代相同。
阅读原文