Kokoro是一款新发布的语音合成模型,具有8200万参数,迅速在TTS领域崭露头角。
其在Hugging Face平台上发布后,凭借仅用不到100小时的音频数据,便在排行榜上夺得第一,展现了超高的性价比。
尽管目前存在声音克隆的局限性,但其训练过程的合规性和高效性为未来的发展奠定了基础。
Kokoro-82M 是一款新发布的语音合成模型,具有8200万参数,支持多种语音包。
该模型在 TTS 领域表现卓越,曾在排行榜上排名第一,仅用不到100小时的音频数据进行训练。
Kokoro 模型的训练采用了开放许可证的数据,确保合规性,但目前仍存在一些功能限制。