OpenAI重磅推出了三款新语音模型,分别为:gpt-4o-transcribe,gpt-4o-mini-transcribeandgpt-4o-mini-tts,其中gpt-4o-transcribe备受关注。
该模型在语音转录领域表现出色,错误率显著降低,尤其在英语转录中达到了2.46%。此外,gpt-4o-transcribe支持多种复杂环境下的转录,并具备噪声消除和语义语音活动检测等技术。
gpt-4o-transcribe的错误率在英语转录中低至2.46%,显著优于前代模型Whisper。
支持超过100种语言,并在嘈杂环境和不同口音下保持高准确性。
开发者可通过API轻松集成新模型,推动语音交互应用的发展。