科技魔方

MiniMax Audio推Speech-02语音模型,一次性可以输入20万字符

更多动态

2025年04月02日

  MiniMax Audio最近推出了全新的Speech-02系列语音模型,支持超过30种语言,且一次性可输入多达20万字符。

  新模型不仅在语音合成的自然度上达到了99%的人声相似度,还解决了音频播放中的节奏故障问题,确保了流畅的听感。

  此外,新的“Read Anything”功能和“Long-Text Mode”使得用户可以更方便地获取和处理长文本内容,极大地提升了用户体验。

  Speech-02系列支持30多种语言,语音相似度高达99%,提供自然流畅的音频体验。

  新增的“Read Anything”功能允许用户上传文件或粘贴URL,随时收听各类内容。

  “Long-Text Mode”支持一次性输入20万字符,便捷处理长文本,适合音频书籍和播客制作。

588 +1

来源:科技魔方

延展资讯