北京大学与华南理工大学的研究团队提出了一种全新的任务:可解释的图像伪造检测与定位(e-IFDL),并设计了一个新颖的多模态伪造检测定位框架:FakeShield。
OmniGen是一款全新的图像生成模型,与以往工具不同的是,它具备多种能力,包括文本到图像生成、图像编辑等,用户只需提供简单提示词即可控制图像生成与精细编辑,无需使用ControlNe等插件。
ElevenLabs最新推出的AI语音生成工具Voice Design开创了AI配音领域的新纪元,通过简单的文本描述即可创建个性化语音,为用户提供了直观的文本提示功能,支持调节多个语音参数,包括年龄、性别、口音、语调和音高,同时突破性地支持创作角色化语音,为内容创作者提供了前所未有的声音定制自由。
2024中国计算机大会上,快手副总裁、大模型团队负责人张迪宣布,可灵AI将内测视频人脸模型功能,基于创新的ID保持能力,支持用户自助训练人脸模型,完成训练后,可使用该模型进行5s/10s的文生视频,解决以往AI视频生成中,无法打造稳定人物IP角色的难题。
手机内的 AI 智能体在明确需求后,就会自动阅读理解手机屏幕上的内容,自动操作手机上的美团 APP,无需传统语音助手的多轮次对话,你只需要最后点击下单付钱的按钮就行了。
今天凌晨,OpenAI发布了全新扩散模型方法sCM,仅需2步就能生成高质量图片、3D模型等实现50倍时钟加速,尤其是在高分辨率任务上相当出色。
10月23日消息,据新浪科技报道,苹果CEO库克在探访新浪总部时被问及Apple Intelligence在国内何时上线时回应称:正在努力走完相关流程,相信会很快。
L-Ring2是一款智能指环,集成了先进的人工智能技术,支持实时翻译、语音转文本、手势控制等功能。
-------------没有了-------------