本文来自于微信公众号 机器之能(ID:almosthuman2017),作者:机器之能。
有人预测2024将是视频之年,其实今年已经看出端倪。
年终将至,图像、视频生成战场仍然高潮迭起。
前阵子上线的 Pika Labs1.0炸了一波,Meta 又推出一个免费的 AI 图像生成器,口碑不错。
谷歌 DeepMind最新文生图模型 Imagen2毫无悬念地登上了今天的头条 。如果有内测资格,你会发现谷歌搜索居然可以直接生图。
进入谷歌实验室,测试中的谷歌搜索可以直接生图了。
与此同时,之前热度不减、但一直处在内测阶段的 AI 设计工具 Krea AI Beta 版也终于开放,现在可以免费体验(部分功能)。
与一般文生图工具稍有不同的是,Krea AI 主打一个实时性。它是一个创意工具包,除了当红的实时生成工具(Real-time Generation )、增强工具( upscale&enhance ),还有几个特定功能的小工具。
背靠2,500多个 AI 模型,Krea AI可以应对不同艺术风格品味的需求。尤其是实时生成工具,凭借惊人的生成速度和对画面效果的精准控制,备受瞩目。
实时生成工具提供四种生成方式(界面左边):文本到图片、图生图、屏幕(比如截屏、壁纸)生图、直接拍摄生图。
还可以选择几种图片效果(界面右边),比如没有指定风格、插图、电影、流光等。
中间是一个看板,也是体验何谓「实时」的地方—— 输入文本提示时,每敲一个单词、或者删除一个单词,图片内容都会立刻随之变化。
比如,当我们输入「一个叫尼尔斯的男孩」时,画面是这样的:
输完 「一个叫尼尔斯的男孩儿,骑着一只飞翔的大鹅」时,画面变成了这样:
当我们继续添加「带条围巾」时,画面又变了:
与「文生图」不同,「图生图」对作品效果控制力更好。因为除了文本,你还可以借助一些简单的线条、色块工具,涂鸦几笔,勾勒作品的大致轮廓,供机器加强「理解」。
我们先用工具画了个非常简单的猪头:
然后,输入文本提示「一头微笑的猪」,结果就出来了:
这是网友的作品,是不是很漂亮:
一位网友仅用四分钟,就将自己孩子一样的涂鸦变成了一幅逼真的 AI 肖像:
这是官方给到的展示:
正如前文所述,除了文本、涂鸦,你还可以通过捕获设备屏幕的内容(比如网页、视频)或者用摄像头获取图片来源,然后输入文本提示,生成新的图像作品。
实时生成图片,难免模糊、分辨率低,你还想让作品细节更完美,这时,Upscale & Enhance 就派上用场了—— AI 能以更高分辨率、甚至想象力重新创建视觉内容。因为是付费服务,我们选用了一些官方和网友的体验案例:
你可以调节 AI 发挥自己创造力的程度,如果很高的话,原图被修改的幅度也会很大。比如,这个作品里,美女的脸都被换了。
这也是 AI 生成工具和传统数学算法类润色工具的主要区别,前者会用自己的想象力替换像素内容,而不是刻板遵守。
除了速度和效果,任何新设计工具要想具有生命力,还必须具有良好的兼容性——能与常见的设计工具无缝对接,比如Photoshop、Illustrator、Figma、Blender、Sketchfab 等。Krea 也是如此。
另外,Krea AI 还有一个引人注目的功能——能与 iPad 无缝连接。看,这个孩子寥寥数笔就创造了蜘蛛侠:
另外,Krea AI 还有两个特定功能的小工具,但都不提供实时生图体验。输入要求后,需要等一定时间才能看到结果。
一个是 AI pattern ,输入文本提示,再选择你要的图案,即可以生成带有该图案的图像。
另一个是 Logo Illustration 。和 pattern 功能类似,只不过图案变成了这里的 Logo,专门生成 Logo 形状相关图像。
写到这里,还没卷完。
其实,在 Krea AI 推出增强工具之前,他的竞争对手Magnific AI 已经发布了类似功能:
除了图片,AI 的增强能力还被扩展到视频上。
Upscale-A-Vide是南洋理工大学S-Lab 实验室开发的一个用于视频超分辨率的时间一致性扩散模型,结合低分辨率视频和文本提示,能将低分辨率视频转换为高分辨率。
是啊,谁不想看到童年最爱卡通片的4k 版本?
实时生图方面,不想 Krea AI 专美于前, Leonardo AI 前几天也宣布推出实时绘图工具「实时画布」。
Freepik 的实时草图到图像生成器「Pikaso」也上线了,让涂鸦立刻变成画作:
更疯狂的,Decohere AI 也预告了他们新的实时 AI 视频生成平台。