亚马逊开发出有史以来最大的文本转语音模型_科技魔方-中文AI大模型门户网站

首页 更多动态 正文: 亚马逊开发出有史以来最大的文本转语音模型; 更多动态

2024年02月18日

点赞; 　　2月18日消息，据外媒报道，亚马逊的一个人工智能研究团队宣布，他们开发出了有史以来最大的文本转语音模型。所谓“最大”，是指拥有最多的参数，使用最大的训练数据集。

　　外媒报道称，这个名为BASE TTS的新模型拥有9.8亿个参数，在同类产品中最大，在规模和能力上都超越了之前的迭代版本。它使用了10万个小时的录音(来自公共网站)来进行训练，其中大部分为英语语音，但也包括德语、荷兰语和西班牙语，这使它成为自然语音的新标准。

　　研究人员表示，尽管遇到了文本转语音引擎固有的困难，如发音错误或语调错误，但该模型在处理复杂的语言结构方面表现出了非凡的能力。

　　研究人员进一步指出，与之前的文本转语音模型相比，该模型提高了单词的发音质量。

　　外媒称，这一突破标志着文本转语音技术的发展向前迈出了重要的一步，在不久的将来有可能得到广泛的应用。

　　然而，该团队表示，为了避免滥用，BASE TTS不会向公众发布。相反，他们计划把它作为一种学习应用。(小狐狸)

+1; 来源：TechWeb 作者：小狐狸

延展资讯

: 魅族宣布All in AI 将停止传统「智能手机」新项目

: 语音生成的「智能涌现」：10万小时数据训练，亚马逊祭出10亿参数BASE TTS

: 苹果展示AI新模型MGIE 可一句话精修图片

: 700亿参数「APUS大模型3.0伶荔」中文大模型已开放

: 行业首家！TCL实业通过国家大模型算法备案

: 月之暗面 Moonshot AI 开放平台启动公开测试

最热新闻最新新闻 更多>

用户推荐最热产品 更多>

倾城

小新

张影

创维电视（SKYWORTH）55V40

创维电视（SKYWORTH）55V40

小米全面屏电视E43K

小米全面屏电视E43K

康佳（KONKA）55D6S

康佳（KONKA）55D6S

荣泰S60按摩椅

荣泰S60按摩椅

自媒体头条更多>: 极致听感智能降噪三星Galaxy Buds Pro诠释非同凡“响”

未来科技范试驾摩灵MOi｜视频

品牌专区更多>

产品与服务

联系站长

反馈邮箱

news#keji100.net（发邮件时把#换成@）

关于我们