科技魔方

OpenAI推全新语音转录模型gpt-4o-transcribe,语音转文字准确率飙升

OpenAI

2025年03月21日

  OpenAI重磅推出了三款新语音模型,分别为:gpt-4o-transcribe,gpt-4o-mini-transcribeandgpt-4o-mini-tts,其中gpt-4o-transcribe备受关注。

  该模型在语音转录领域表现出色,错误率显著降低,尤其在英语转录中达到了2.46%。此外,gpt-4o-transcribe支持多种复杂环境下的转录,并具备噪声消除和语义语音活动检测等技术。

  gpt-4o-transcribe的错误率在英语转录中低至2.46%,显著优于前代模型Whisper。

  支持超过100种语言,并在嘈杂环境和不同口音下保持高准确性。

  开发者可通过API轻松集成新模型,推动语音交互应用的发展。

556 +1

来源:科技魔方

延展资讯