英伟达最新发布的Blackwell平台在AI训练领域取得了巨大突破,性能提升达到了前代产品的2.2倍,引起了业界广泛关注。
CogSound是一款基于人工智能技术的音效生成模型,能为无声视频添加逼真的音频体验,让观众享受身临其境的音效体验。
Suno 公司最新发布的v4音乐生成模型展现出显著的音质和多样性提升,通过深度学习技术生成更自然和富有表现力的音乐作品。
谷歌最近推出了名为Vids的AI视频演示应用程序,利用Gemini AI模型驱动,用户可以通过简单的文字提示或上传Google Drive文档生成视频演示文稿。
AI Blueprint主要用于开发视觉AIAgent,几乎任何行业都能开发出用于分析视频、图像的AI Agent来提升工作、监控效率等。
Runway最新推出的高级摄像机控制功能让用户像导演一样掌控虚拟场景中的镜头移动,为AI视频创作带来前所未有的灵活性和掌控力。用户可以实现水平移动、环绕拍摄、位置探索、循环拍摄等多种效果,极大拓展了创作潜力。
D-ID推出两款新型虚拟头像Express和Premium+,旨在提升内容创作的质量和效率,满足企业在市场营销、销售和客户支持等领域的需求。
Wonder Dynamics发布了颠覆性的AI工具Wonder Animation测试版,利用人工智能重新定义影视制作流程。
OPPO宣布与InterDigital签署全球专利许可协议,协议涵盖InterDigital的蜂窝网络、HEVC视频及WiFi专利。
Video-XL是一款专为高效的小时级视频理解而设计的超长视觉语言模型,利用“视觉上下文潜在摘要”技术将长视频内容压缩成精简形式,提高效率并保留关键信息。
趣丸科技发布了名为MaskGCT的全新语音合成(TTS)模型,彻底颠覆了传统TTS模型的玩法,实现了自学成才,不再依赖人工标注。
字节跳动最新开发的PersonaTalk AI模型实现了视频精准配音,声音与嘴型完美同步,保留人物原有特点,让视频更真实自然。
智源研究院联合上海交通大学、中国人民大学、北京大学和北京邮电大学等多所高校带来最新成果超长视频理解大模型Video-XL。
Runway最新推出的Act-One工具深深震撼!这项革命性技术利用生成式AI模型,仅凭演员的视频和语音输入,就能轻松生成栩栩如生的角色动画,彻底颠覆了传统的动画制作流程
Adobe 本周宣布了 Adobe Express 的一系列新功能,旨在为需要创建网页和图形的主流用户提供更高的集成度和创作能力。
-------------没有了-------------