PALP是一种用于文本到图像生成的个性化方法。该方法通过使用得分采样来保持模型与目标提示的对齐,从而提高文本对齐度,并能够生成复杂和精细的图像。
元象发布了全球首个上下文窗口长度为256K 的开源大模型 XVERSE-Long-256K,支持输入25万汉字,无条件免费商用。
知网 AI 智能写作推出了新功能模块 —— 写作选题,它采用了最新的人工智能大模型技术,并以知网总库的海量学术文献资源作为底层分析数据,为研究者和写作者提供科学、智能的写作主题推荐服务。
在使用强化学习(RL)进行文本生成图像(T2I)时,质量奖励成为一个紧迫问题。尽管观察到通过强化学习RL可能提高图像质量,但多个奖励的聚合可能导致在某些度量中过度优化而在其他度量中降级。
DDColor是一款照片级、真实感的图像着色工具,采用了双解码器技术,能够同时考虑色彩分布和像素级详细信息,实现高度真实的图像上色效果。
在最新的研究中,Mistral AI 的研究团队推出了一款名为 Mixtral8x7B 的语言模型,该模型基于新的 Sparse Mixture of Experts(SMoE)模型,具有开放权重。
近日,香港科技大学与微软亚洲研究院的研究团队联手开发的CoMoSVC技术在歌声转换领域取得了革命性突破。
南洋理工大学与商汤科技的S-Lab团队近日发布了一项令人振奋的研究成果,推出了基于Gaussian Splatting的高效3D人体建模框架,被命名为GauHuman。
-------------没有了-------------