Meta周三推出了名为AudioCraft 的开源人工智能工具,该工具将帮助用户根据文本提示创建音乐和音频。它允许用户完全通过生成式 AI 创作音乐和声音。
“既是天使、也是魔鬼”,或许是如今对AI最为精确的一句描述。如今再度走红的AI在帮助人类社会实现效率革命的同时,同样也带来AI新闻造假的泛滥以及愈演愈烈的AI骗局,因此监管AI就成为了当下科技界一个重要的议题。
今年早些时候美国田纳西州健康科学中心的放射学家 Som Biswas 引起关注,因为他在《放射学》杂志上发表了一篇由人工智能聊天机器人 ChatGPT 协助写作的文章,题为《ChatGPT 与医学写作的未来》。
Meta 公司推出了 Massively Multilingual Speech(MMS)项目,为 1100 多种语言提供了先进的语言转文本、文本转语音服务,且支持将近 4000 多种未标记的口语。
OpenAI在研究文本到三维对象方面取得了快速进展。已经托管至GitHub的Shap-E据称可以直接从文本描述中生成3D asset,或者从提供的图像中构建相关内容。
Meta 公司发布了一个新的开源人工智能模型 ImageBind,该模型能够将多种数据流整合在一起(包括文本、音频、视觉数据、温度和运动读数等)。
继文本生成图片模型 DALL・E 之后,OpenAI 近日再次发布了 Shap・E 模型。用户可以输入文本,用于创建逼真且多样化的 3D 模型。
4月19日消息,美国数据合成公司Synthesis AI发布新款生成式AI Avatar方案:3D Generative AI,并预计在今年第二季度开启beta测试。
位于美国旧金山的Synthesis AI是一家专门从事合成数据技术的初创公司。团队日前宣布,他们开发了一种可以通过文本提示创建逼真虚拟数字人的新方法。
-------------没有了-------------