Meta公司正全力投入生成式AI技术,计划在2026年之前推出一个能够支持视频内容的全新AI模型。根据Facebook总裁汤姆·艾利森(Tom Alison)在旧金山摩根士丹利科技大会上的广泛讨论,该公司的技术路线图将专注于开发一个能够推动视频领域的AI模型,包括Reels和更长的发布形式的内容。
为了解决这一问题,NaturalSpeech3提出了一种创新的TTS系统,采用了新颖的分解扩散模型,以零样本的方式生成自然语音。也就是提供文本和参考音频,可以克隆音色和感情,值得注意的是,NaturalSpeech3目前只有论文。
Adobe正式将其生成式人工智能(GAI)技术Firefly引入移动设备。最新版本的Adobe Express测试版在Android和iOS上都推出了Firefly GAI功能,为用户提供了更广泛的图像创建和编辑选项。
近日,MyShell公司宣布其多语言、多口音的文本转语音库MeloTTS正式开源。这一消息在开源社区引起了广泛关注。MeloTTS支持的语言包括英语、西班牙语、法语、中文、日语和韩语,为开发人员提供了丰富的选择。
加利福尼亚大学圣地亚哥分校(UCSD)和南加利福尼亚大学(USC)的研究人员最近推出了一种名为 CyberDemo 的新型人工智能框架,旨在通过视觉观察进行机器人模仿学习。
Voicepanel是一个利用AI进行语音或视频采访的产品,帮助企业以较低成本获取客户反馈,远比传统的人工访谈更便宜。其使用户能够在短时间内进行大量对话,获取比传统调查更深入的洞察。
近日,由李开复旗下的AI公司零一万物发布的新一代开源模型Yi-9B引起了业界的广泛关注。该模型是Yi系列中最强的模型,实际参数为8.8B,默认上下文长度为4K tokens。
在花旗银行,生成式人工智能(Gen AI)已经在推动数据驱动决策方面取得了积极而深远的影响。花旗银行的首席分析技术与创新负责人Promiti Dutta表示,Gen AI的出现引起了银行内部的一场大变革,将数据和分析置于所有事务的前沿。
-------------没有了-------------