科技魔方

小型文本转语音模型Kokoro-TTS,曾拿下TTS排行榜第一

更多场景

2025年01月15日

  Kokoro是一款新发布的语音合成模型,具有8200万参数,迅速在TTS领域崭露头角。

  其在Hugging Face平台上发布后,凭借仅用不到100小时的音频数据,便在排行榜上夺得第一,展现了超高的性价比。

  尽管目前存在声音克隆的局限性,但其训练过程的合规性和高效性为未来的发展奠定了基础。

  Kokoro-82M 是一款新发布的语音合成模型,具有8200万参数,支持多种语音包。

  该模型在 TTS 领域表现卓越,曾在排行榜上排名第一,仅用不到100小时的音频数据进行训练。

  Kokoro 模型的训练采用了开放许可证的数据,确保合规性,但目前仍存在一些功能限制。

+1

来源:科技魔方

延展资讯