百度在今日的 AI 开发者大会上宣布,文心一言用户数已突破2亿,同时 API 日均调用量达到2亿,该用户量自公司去年12月更新以来大约翻了一番。
实验数据上,这个名为VAR(Visual Autoregressive Modeling)的新方法不仅图像生成质量超过DiT等传统SOTA,推理速度也提高了20+倍。
4月15日晚,全球多媒体巨头Adobe在官网宣布,将OpenAI的Sora、Pika 、Runway等著名第三方文生视频模型,集成在视频剪辑软件Premiere Pro中(简称“PR”)。
爆炸级更新!AdobePremiere Pro正在引入AI工具,以简化视频编辑工作流程并减少完成繁琐任务所需的时间。
EleutherAI最近发布了一款新的T5模型,名为Pile-T5,旨在解决原始T5模型在处理代码相关任务时的局限性,以及其分词器可能遗漏重要代码标记的问题。
在2023年2月,芝加哥大学的一个研究团队发布了一款名为Glaze的免费软件工具,旨在利用机器学习微调用户提供的艺术作品的像素,从而改变其风格,以防止任何AI艺术生成模型对其进行抓取和训练。
香港中文大学终身教授贾佳亚团队最近推出了一款名为Mini-Gemini的多模态模型,该模型在多模态任务榜单上取得了显著成绩,其性能堪比GPT-4与DALLE3的结合。
在人工智能领域,多模态模型的发展一直是行业关注的焦点。近日,马斯克X AI公司发布了其最新的多模态模型——Grok-1.5Vision,这一模型不仅能够处理文本信息,还能够理解和分析各种视觉数据,如文档、图表、截图和照片,标志着公
在快节奏的现代生活中,真正感到被倾听和理解是一件罕见的事情。许多人并没有从周围的人那里得到他们需要的情感支持、共鸣和认可。那么,人工智能(AI)能做到吗?南加州大学马歇尔商学院进行的一项新研究表明可以 —— 但
近日,Claude的东家Anthropic发表博文,称他们开发了一种测量模型说服力的基本方法,并且在Claude系列上进行了实验,相关数据也进行了开源。
北京冬奥运AI 虚拟人手语主播、杭州亚运会数字人点火、新华社数字记者、数字航天员小诤......当随着越来越多数字人出现在人们生活中,整个数字人行业也朝着多元化且广泛的应用方向发展,快速拓展到不同行业、不同场景。
Cohere 发布了 Rerank3,这是一款新的基础模型,旨在增强企业搜索和检索增强生成(RAG)系统。这一新模型将改变企业处理和访问大量数据的方式,提高搜索效率和准确性。
近日,OpenAI宣布推出最新版的GPT-4Turbo,这一消息在人工智能领域引起了广泛关注。目前新版 GPT-4Turbo 已向所有付费 ChatGPT 用户开放,这标志着人工智能技术在语言理解和生成方面的又一重大进步。
中山大学HCP实验室联合Sea AI Lab和哈佛大学等单位开展的一项研究,成功地让大型人工智能模型通过讲笑话的方式,探索多模态大模型的创造力,并因此获得了计算机视觉和模式识别领域的顶级会议CVPR的认可。
据媒体报道,OpenAI的全新GPT-4 Turbo模型已全面上线,并正式向付费ChatGPT用户开放。
4月11日,谷歌在官网宣布从5月15日起,将向所有谷歌相册用户免费提供Magic Editor、Photo Unblur和Magic Eraser三款生成式AI编辑工具。
据新浪科技报道,近日,李彦宏针对大模型发表内部讲话。在内部讲话中,李彦宏对大模型开源与闭源的路线选择以及 AI 创业者应该专注模型还是应用等业界焦点话题,发表了自己的看法。
瑞士洛桑联邦理工学院(EPFL)的研究人员最近进行的一项研究表明,GPT-4在说服力方面比人类表现更出色,优势接近82%,准确来说是81.7%。该研究涉及820人围绕一系列主题展开辩论。
4月11日,蚂蚁集团自研的智能研发平台CodeFuse推出“图生代码”新功能,支持开发人员用产品设计图一键生成代码,大幅提升前端页面的开发效率。目前相关功能正在内
最近,Replicate上的“SDXL fine-tunes”收藏包含了一系列基于SDXL模型的精选微调模型,这些模型专为生成特定视觉风格和主题的高质量图像而设计。这些微调模型利用了大型生成模型SDXL的强大功能,通过针对特定内容进行优化
国内首个音乐ChatGPT来了!提前试用「天工SkyMusic」后,整个编辑部暴风式哭泣:它改编的周杰伦和凤凰传奇简直封神。团队选择了一条少有人走的路,他们赌赢了:比OpenAI提前押中了Sora架构,并且首次在业内公开技术图。
-------------没有了-------------