科技魔方

趣丸科技联合港中大(深圳)开源首个语音大模型,效果全球领先跻身第一梯队

更多场景

2024年10月28日

  趣丸科技首个开源大模型来啦!

图片

  10月24日,趣丸科技宣布与香港中文大学(深圳)联合研发的语音大模型“MaskGCT”正式在Amphion系统中开源,面向全球用户开放使用。区别于传统TTS模型,该模型采用掩码生成模型与语音表征解耦编码的创新范式,在声音克隆、跨语种合成、语音控制等任务中展现出卓越效果。

图片

  MaskGCT在三个TTS基准数据集上都达到了SOTA效果,超过当前最先进的同类模型,某些指标甚至超过人类水平。

+1

来源:科技魔方

延展资讯