科技魔方

微软携手Project Gutenberg利用AI语音技术制作5000本免费有声书

大模型

2023年09月12日

  美国 IT 巨头微软公司近日与古Project Gutenberg合作,利用人工智能技术为该计划的电子书库制作了超过5000本高质量的有声书。这一项目中,研究人员结合了机器学习、自动文本选择和自然语音合成等多项 AI 技术,实现了电子书自动转化为语音的全流程。

  项目团队首先开发出一种算法,可以自动分析电子书的结构,区分正文和非关键部分的页码、表格等,然后使用 WaveNet、Tacotron 和 FastSpeech 等前沿的文本转语音技术,生成类似真人的自然朗读语音。此外,该团队还使系统能够辨别书中叙述者、对话和不同角色,并相应调整语音,实现故事情节的语音表达。

  据悉,此次计划已收集整理了超过35000小时的有声书语音数据,涵盖了各类经典文学、戏剧、传记等作品,这些语音数据都将以开源方式免费提供。用户甚至可以用自己录制的少量语音,生成用自己的声音朗读整本书的效果。这一项目能极大地丰富有声书的内容,也为视障人士提供了便利。

  Project Gutenberg是免费数字图书馆计划,用户可以在其网站免费阅读和下载超过7万本电子书。此次与微软合作制作有声书,将大幅拓展其免费有声书数量,为公众提供便捷的知识获取渠道。

+1

来源:站长之家

延展资讯