谷歌的研究人员最近推出了一款名为 VLOGGER 的多模态扩散模型,能够自动生成带语音、丰富动作的人物视频。用户只需向 VLOGGER 输入图像和语音,就可以获得逼真的视频效果。
据媒体报道,知名投行高盛的Jan Hatzius分析师团队在最新发布的研报中指出,若生成式AI能够实现其所承诺的能力,劳动力市场可能将面临巨大的冲击。
三星表示,他们可能会将生成式人工智能技术应用于其语音助手 Bixby,这是该公司一名高管告诉 CNBC 的。Bixby 于2017年随三星 Galaxy S8智能手机推出。该软件提供了多项功能,包括实时翻译或餐厅推荐。然而,语音助手通常较少具备对话功能,而是依赖用户提问并获取答案。
AI生成视频模型Sora刚诞生一个月,创建者OpenAI计划将之推向好莱坞,建议将Sora应用到电影制作中。最近几周,OpenAI一直与洛杉矶多家影视公司和媒体的高管积极沟通。
这是一场视频面试,屏幕上是一位AI生成的面试官。它问:“你的简历中提到过某个活动,请讲讲你在其中扮演了什么角色?”和以往面试中会打量你的真人不同,这位面试官的肢体动作尚带一些机械感,于是你没那么紧张了。
在数字时代,网站的吸引力和用户体验至关重要。现在,有一款名为Living Images的工具,只需输入网址,就能自动分析和改进您网站上的图片,使它们更具吸引力,更能促进用户行动,比如点击、购买或注册。这或许是提高电商主图点击率的好方法。
在数字时代,视频编辑技术日新月异,如今有一款名为VideoSwap的工具,允许用户轻松替换视频中的主体(如动物、人物或任何物体),同时保持视频的背景环境不变。这一功能为个性化和精确的视频内容编辑提供了更多可能性。
昨天,X AI 发布了其最新的大型语言模型更新——Grok-1.5。该版本在编码和与数学相关的任务中表现出了显著的性能提升。
-------------没有了-------------