云知声AIGC 内容创作平台蓝藻 AI 近日进行全新升级,重点关注 AI 声音克隆和 AI 配音两大核心功能。
Meta公司正全力投入生成式AI技术,计划在2026年之前推出一个能够支持视频内容的全新AI模型。根据Facebook总裁汤姆·艾利森(Tom Alison)在旧金山摩根士丹利科技大会上的广泛讨论,该公司的技术路线图将专注于开发一个能够推动视频领域的AI模型,包括Reels和更长的发布形式的内容。
为了解决这一问题,NaturalSpeech3提出了一种创新的TTS系统,采用了新颖的分解扩散模型,以零样本的方式生成自然语音。也就是提供文本和参考音频,可以克隆音色和感情,值得注意的是,NaturalSpeech3目前只有论文。
Adobe正式将其生成式人工智能(GAI)技术Firefly引入移动设备。最新版本的Adobe Express测试版在Android和iOS上都推出了Firefly GAI功能,为用户提供了更广泛的图像创建和编辑选项。
近日,MyShell公司宣布其多语言、多口音的文本转语音库MeloTTS正式开源。这一消息在开源社区引起了广泛关注。MeloTTS支持的语言包括英语、西班牙语、法语、中文、日语和韩语,为开发人员提供了丰富的选择。
加利福尼亚大学圣地亚哥分校(UCSD)和南加利福尼亚大学(USC)的研究人员最近推出了一种名为 CyberDemo 的新型人工智能框架,旨在通过视觉观察进行机器人模仿学习。
Voicepanel是一个利用AI进行语音或视频采访的产品,帮助企业以较低成本获取客户反馈,远比传统的人工访谈更便宜。其使用户能够在短时间内进行大量对话,获取比传统调查更深入的洞察。
-------------没有了-------------