知网 AI 智能写作推出了新功能模块 —— 写作选题,它采用了最新的人工智能大模型技术,并以知网总库的海量学术文献资源作为底层分析数据,为研究者和写作者提供科学、智能的写作主题推荐服务。
在使用强化学习(RL)进行文本生成图像(T2I)时,质量奖励成为一个紧迫问题。尽管观察到通过强化学习RL可能提高图像质量,但多个奖励的聚合可能导致在某些度量中过度优化而在其他度量中降级。
DDColor是一款照片级、真实感的图像着色工具,采用了双解码器技术,能够同时考虑色彩分布和像素级详细信息,实现高度真实的图像上色效果。
在最新的研究中,Mistral AI 的研究团队推出了一款名为 Mixtral8x7B 的语言模型,该模型基于新的 Sparse Mixture of Experts(SMoE)模型,具有开放权重。
近日,香港科技大学与微软亚洲研究院的研究团队联手开发的CoMoSVC技术在歌声转换领域取得了革命性突破。
南洋理工大学与商汤科技的S-Lab团队近日发布了一项令人振奋的研究成果,推出了基于Gaussian Splatting的高效3D人体建模框架,被命名为GauHuman。
LumaAI发布了Genie1.0版本,这是一个文本到3D模型的转换工具,能够在不到10秒内根据文本描述创建任何想象中的3D对象。
近期,一项名为"Jump Cut Smoothing for Talking Heads"的研究提出了一种创新性的框架,用于在说话头部视频中平滑处理跳切,提升观看体验。
-------------没有了-------------