MiniMax Audio最近推出了全新的Speech-02系列语音模型,支持超过30种语言,且一次性可输入多达20万字符。
新模型不仅在语音合成的自然度上达到了99%的人声相似度,还解决了音频播放中的节奏故障问题,确保了流畅的听感。
此外,新的“Read Anything”功能和“Long-Text Mode”使得用户可以更方便地获取和处理长文本内容,极大地提升了用户体验。
Speech-02系列支持30多种语言,语音相似度高达99%,提供自然流畅的音频体验。
新增的“Read Anything”功能允许用户上传文件或粘贴URL,随时收听各类内容。
“Long-Text Mode”支持一次性输入20万字符,便捷处理长文本,适合音频书籍和播客制作。