春节期间,由Openai推出的最新AI生成视频技术引发全球性讨论和关注,这项技术让大家对AI未来的发展趋势增加了无限可能。
LaVi-Bridge项目是一个无需训练将不同的语言模型和生成视觉模型结合起来,以实现文本到图像的生成的项目。
近期,香港大学发布了OpenGraph,这是一项突破性的成果,成功攻克了图基础模型领域的三大难题。该模型通过巧妙的技术实现了零样本学习,可以适配多种下游任务。OpenGraph的构建主要分为统一图Tokenizer、可扩展的图Transformer和大语言模型知识蒸馏三个部分。
Sora计划在今年内发布。据悉,Sora将推出一种全新的视频生成技术,能够在短短几分钟内生成一段20秒的720p视频,而不需要花费几个小时的时间。
Gifshift是一个能够将GIF转换成另一个GIF的工具,用户只需上传一个GIF,然后输入他们想要的提示,描述性和标志性的角色效果。
人工智能技术领域的领先者Anthropic公司最近发布了其最新的Claude3AI模型系列成员,名为Claude3Haiku。这款全新的智能产品被定位为速度最快、成本最实惠的型号,在提供先进的视觉功能和行业标准性能的同时,为企业客户提供了全方位的选择。
亚马逊最新发布了一项生成人工智能功能,允许卖家仅通过复制粘贴外部网站链接即可生成对应商品的亚马逊产品页面,包括文字描述和图片。
初创公司 Cognition 近日发布公告,宣布推出全球首个 AI 软件工程师 Devin,并号称会彻底改变人类构建软件的方式。
清华大学与阿里安全联合发布了概念半透膜模型(SPM),这一模型能够在 Diffusion 架构的 AI 作图模型中,精准、可控地擦除各类具象或抽象概念。
由颜水成和程明明领衔的研究团队在Sora核心技术上进行了重要的升级,推出了Masked Diffusion Transformer V2。该模型在ImageNet benchmark上取得了惊人的成绩,FID score达到1.58,刷新了State-of-the-Art(SoTA)。
-------------没有了-------------