CoMoSVC是一种能够将一个人的歌声转换成另一个人的歌声的创新技术。这个项目是由香港大学和微软亚洲研究员共同开发的,它在高质量音频转换和快速处理速度之间找到了平衡,是语音转换领域的重大进步。
MetaAI最近发布了一项引人注目的技术,他们成功地开发出一种能够从音频中生成逼真的虚拟人物形象的系统。
悉尼科技大学的科研人员,通过大语言模型、EEG(大脑活动检测工具)、脑机接口等技术,开发了一个可自动读取人类想法,并转化成文本的AI大模型——DeWave。
Pile是一款非常整洁美观的开源AI日记软件。它不仅可以帮助你撰写和保存日记条目,记录你的思考和经历,还可以作为备忘录使用。Pile内置了OpenAI的API功能,让你可以通过写下提示词来扩展你的想法和日记内容。
利用人工智能来合成视频一直是该领域的难题,因为其中最关键的一环——映射与合成,缺乏优秀的模型算法,只能利用卷积神经网络(CNN)和生成对抗网络(GAN)来不断提取特征、生成、判断,直至最后结果。
随着三星即将于1月17日推出Galaxy S24系列,一场以人工智能为主题的“移动新时代”正式拉开序幕。在最新的预告片中,三星通过回顾自家手机的历史,强调了其在塑造手机演进方面的关键作用。
图像修复一直是一个备受研究者关注的复杂挑战,其主要目标是在维持降质输入的感知质量的同时,创建视觉上吸引人且自然的图像。在没有有关主题或降质的信息的情况下(盲目恢复),了解自然图像范围至关重要。
近期,GPT-4V的开源替代方案在中国的顶尖学府清华、浙大等的推动下,出现了一系列性能优异的开源视觉模型。其中,LLaVA、CogAgent和BakLLaVA是三种备受关注的开源视觉语言模型。
周一,美国时间,X平台上有一位网友发出了这样的疑问:“ 2024 年我们还能享受一个正常的生活吗?在经历了四年的乱象之后,我们难道不该有这样的权利吗?”对此,马斯克回应说,“我觉得 2024 年会更加混乱。”
据科学技术部消息,科技部监督司近日编制印发《负责任研究行为规范指引(2023)》,提出不得使用生成式人工智能(AIGC)直接生成申报材料,不得将生成式人工智能列为成果共同完成人,同时强调科研人员应把科技伦理要求贯穿到研究活动的全过程。
-------------没有了-------------