"Anything in Any Scene"是一项新颖的技术,可以在现有的动态视频中无缝地插入任何物体,从而增强视频的视觉效果和真实感。该技术的主要特点包括准确放置物体、真实模拟光照和阴影效果以及保持视觉风格一致性。
成立仅两年的AI音频公司ElevenLabs近日宣布B轮成功融资8000万美元,估值超过10亿美元,成功晋升为独角兽公司。
SegMoE是一种无需训练就可以混合多个SD模型组成一个新的模型,类似LLM的MoE模型。据称,他们提供了三个已经混合好的模型,分别由2个SDXL、4个SDXL和4个SD1.5模型组成。
苹果开源了一种新的技术,名为多模态大语言模型引导的编辑(MGIE),这项技术能够帮助用户通过自然语言指令来修改图片,使得编辑图片更加简单和自然。
无论是开源的LLaMA2还是闭源的GPT系列模型,功能虽然很强大,但对语言的支持和扩展比较差,例如,二者都是以英语为主的大模型。
-------------没有了-------------