技术-科技魔方_中文AI大模型门户网站

技术

谷歌研究团队推新AI方法SynCLR:从合成图像和字幕中学习视觉表征

近期，Google Research和MIT CSAIL共同推出了一项名为SynCLR的新型人工智能方法，该方法旨在通过使用合成图像和字幕，实现对视觉表征的学习，摆脱对真实数据的依赖。

站长之家谷歌

726

Github爆火AI语音克隆项目OpenVoice，精准进行声音复刻

最近，Github上的一个名为OpenVoice的AI语音克隆项目爆火，该项目由myshell-ai开源，仅开源了不到三周，就有了6.1k的star。

站长之家

699

文生图模型TrailBlazer：利用边界框控制视频对象轨迹

在最近的文本到视频生成(T2V)方法中，实现合成视频的可控性通常是一个挑战。通常情况下，为了解决这个问题，需要提供低级别的每帧指导，如边缘图、深度图或待修改的现有视频。

站长之家 文生图TrailBlazer

720

AI视频何时才能跑出一个“Midjourney”?

AI视频一跃成为“明日之星”，大厂和创业公司们打得热火朝天。

微信公众号光锥智能 AI视频

553

科学期刊将引入AI工具Proofig检测图片欺诈

日前，科学期刊Science宣布其所有期刊将开始使用商业软件，自动检测不当篡改的图像。

站长之家

573

Wild2Avatar可逼真渲染视频中被遮挡的人物

在渲染移动人物的视觉外观时，面对摄像头视野被遮挡的问题是一项巨大的挑战。

站长之家

608

Robin AI融资2.6亿美元，推动AI法律合同解决方案全球化

英国公司Robin AI最近宣布成功完成了一笔规模为2.6亿美元的B轮融资，使其总融资额接近4.3亿美元。

站长之家 RobinAI

726

Midjourney训练AI使用的艺术家数据库名单泄露引发争议

根据最新报道，用于训练Midjourney的生成式人工智能(AI)程序的艺术家数据库已泄露，引起社交媒体和艺术界的广泛争议。泄露的名单中包括一些知名艺术家，如Banksy、David Hockney等。

站长之家

619

视觉编码器VCoder：提高模型在识别图像方面的能力

VCoder是一个视觉编码器，旨在提高多模态语言模型(MLLM)在识别图像中的对象和理解图像场景方面的能力。它能够帮助模型更好地理解和分析图像内容。

站长之家 视觉编码器VCoder

644

微软研究人员推新AI方法，用合成数据改进高质量文本嵌入

微软公司的研究团队最近提出了一种独特且简单的方法，用于生成高质量的文本嵌入。这种新方法仅使用合成数据和极少的训练步骤(少于1，000步)，就取得了令人瞩目的成果。

站长之家微软AI

635

-------------没有了-------------

图赏更多>

: 谷歌 AI 模式新增多模态搜索，支持图像提问功能

: 鲁大师2025年新能源汽车Q1季报：全新驾舱流畅榜单上线，极氪车机强势翻身

: 网易严选9周年庆狂欢开启，多重惊喜回馈新老用户

: 深圳科乐新能源亮相2025中东国际能源展,发布全新大单体电芯500W储能方案

: 第四代骁龙8s正式发布，“新生代”旗舰有何真实力？

: 2028年中国AI总投资规模将超千亿美元，五年复合增长率达35.2%