科技魔方

AMD显卡也能“炼丹”?实战DirectML加速AI绘图

大模型

2023年11月21日

  本文来自于微信公众号 三易生活(ID:IT-3eLife),作者:三易菌。

  前言:AMD显卡也能吃上AI绘图的红利吗

  众所周知,随着AIGC相关技术最近这一两年快速成熟,也使得AI绘图早已经不再仅仅是部分PC发烧友或AI爱好者的“玩具”。

  例如在一些游戏里,现在已经可以看到AI绘制的角色或是AI设计的服装,它们正在变得越来越精致,同时也受到了许多玩家的好评。此外在一些工业产品上,“由AI参与设计”也成为了最新的营销噱头。与人类设计师相比,AI的“思路”有时会显得格外天马行空,为产品注入显眼的亮点。

  除此之外,在电商、外贸等领域,通过AI来绘制产品宣传图也成为了时下最新的热门话题。由于与人类画师相比,AI图像生成程序“任劳任怨”,还支持反复不断地修改方案,因此在综合成本上也有着显著的优势。

  话虽如此,但只要用过AI绘图工具的朋友可能都知道,以Stable Diffusion为代表的绘图工具在易用性方面,普遍还存在着一些短板。其中最为突出的一点,就在于它们之中的很多版本,依赖的都是特定品牌显卡的特定私有AI体系。如此一来,这就导致相关显卡遭遇了一波又一波的炒作,不仅价格居高不下,甚至最近还出现了疑似部分型号遭遇禁售的传言。

  说实在的,这些对于大型企业、设计工作室来说都不是什么问题,因为他们完全消费得起更专业、同时也更昂贵的AI加速卡,而且也熟稔Linux系统下更高效的种种AI绘图工具。

  但如果是一般的个人用户呢,或者是对于诸如网店店主、小型游戏开发者这类,对于AI绘图有需求,但财力又相对有限的用户来说,难道就真的没有办法以更低的价格和技术门槛,来吃上这一轮“AI”红利了吗?

  幸好微软和AMD联手,给出了解决方案

  办法当然是有的,就以大家熟悉的Stable Diffusion来说,它本身就具备Windows客户端版本,因此并不需要非得使用Linux或者更专业的操作系统。

  其次,此前主流Stable Diffusion版本所使用的Pytorch指令,对于AMD GPU“天生”缺乏优化,这是造成A卡运行AI绘图效果不佳的最核心原因。但现在借助Microsoft Olive工具,Pytorch指令会被实时转换为ONNX,然后便可以通过AMD GPU自带的DirectML加速功能进行加速,大幅提升“AI绘图”的效率。

  在此基础上,自今年7月底更新的驱动版本(23.7.2)之后,如今AMD GPU已经实现了对Microsoft Olive的原生支持。因此如今只需要在Windows系统下,配置一套启用了Microsft Olive、支持DirectML加速的Stable Diffusion,就可以很简单地享受到由A卡带来的AI绘图体验,再没有过多的成本和技术门槛了。

  测试平台:锐龙9+高频内存,三款显卡同时参测

  前面说了这么多,那么A卡+Windows系统如今在Stable Diffusion的AI绘图场景下,性能表现到底如何呢?

  为了探究这个问题,我们三易生活基于一套由锐龙9-7950X处理器,搭配32GB DDR5-6400内存,并使用最新版Windows11专业工作站版的测试平台。

  需要注意的是,AMD的锐龙7000系列平台在刚上市那阵子,对于超过6000MHz的DDR5内存兼容性并不太好,直到前段时间通过BIOS更新,才“解锁”了明显好得多的内存兼容性。所以如果也想与我们一样,在如今的AMD平台上使用高频DDR5内存,建议先将主板BIOS更新到最新版本才更为稳妥。

  在测试显卡方面,为了更广泛地覆盖尽可能多的用户群体,我们选择了三款,分别是Radeon RX7900XTX、RX7900XT和RX7700XT。

  其中,RX7900XTX我们此次使用了不仅具备完整的96CU单元、192AI加速器和24GB显存配置,同时默认频率也比公版更高、达到了2565MHz的版本。

  相比之下,RX7900XT和RX7700XT我们使用的也是具备出厂超频设计,并配备了比公版方案体量大得多的三风扇+多热管散热设计的版本。其中尤其是两款7900系列显卡的三槽散热器设计,无论拿在手里的“分量”、还是装在机箱里的视觉效果,也都相当惊人。

  当然,从经验来说,短期内的AI绘图并不会对显卡造成像游戏那么大的性能压力,但谁又不希望自家显卡可以在“炼丹”时更安静、更凉快一点呢?

  测试结果:DirectML显神威,A卡“炼丹”大加速

  值得一提的是,就在我们进行测试的这段时间,原版Stable Diffusion使用时所需访问的大模型网站正好陷入长期的连接困难之中,这确实一度给测试带来了不小的困扰。

  好在经过一番摸索后我们发现,其实现在国内已经有爱好者制作出了更加本地化,配置起来也更容易的Stable Diffusion WebUI方案。而且其同样拥有DirectML版本,可以使用AMD显卡进行AI加速。

  针对此次绘图测试,我们使用了以下参数:

  生成关键词:

  dynamic pose, dynamic angle,(masterpiece:1.4, best quality), unity8k wallpaper, ultra detailed, beautiful and aesthetic, perfect lighting,detailed background, realistic

  去除关键词:

  EasyNegative,nsfw, lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry, bad feet, text,logo

  分辨率设置:512×512

  采样步进:20

  提示词引导系数:7

  生成数量:15-1,1-1

  RX7700XT生成15张图片,总用时115.8秒、平均每张图片耗时7.72秒

  RX7900XT 生成15张图片,总用时77.8秒、平均每张图片耗时5.19秒

  RX7900XTX 生成15张图片,总用时67.7秒、平均每张图片耗时4.51秒

  可以看出,一方面有了DirectML加速途径,如今AMD显卡在AI绘图的效能上已经不低。尤其是对于RX7900系列显卡来说,大显存加上更多的AI单元加持,使得其明显具备更高的生成速度。

  根据上面的测试结果我们将三款显卡的平均每张图片耗时成绩汇总成了上面这张柱状图,可以看到RX7900XTX虽然有着明显更快的速度,但相较之下,RX7900XT与其仅15%的性能差异,显然没有价格方面那么明显。对于要求没有那么高的朋友来说,即便是与RX7900XTX在性能方面有着71.2%差距的RX7700XT,两者近一倍的价格差,无疑也使得RX7700XT有着不错的性价比。

  针对这一点,我们也出于好奇心进行了一次连续生成100张图片的追加测试。可以看到,RX7900XTX应对自如,仅用时450.8秒就完成了全部任务,平均每张图片的生成速度完全没有变慢,依然维持在4.51秒一张的效率上。

  总结:AI绘图现在已经有了更具性价比的选择

  说实在的,由于过去很长一段时间生成式AI绘图工具对于AMD显卡的支持力度确实不算太好,这造成了大量有需求的用户不得不额外去购买昂贵显卡的局面,客观上给消费者带来了更多的开销,也在一定程度上阻碍了生成式AI绘图本身的技术发展速度。

  好在随着AMD和微软联合优化的Microsoft Olive工具,以及由此衍生的DirectML版本Stable Diffusion发行版诞生,A卡用户们终于不需要再羡慕他人的“炼丹”效率,也不再需要配置繁琐的Linux和RCOM环境,直接就能在Windows系统下像其他显卡一样,方便地使用AI绘图工具了。

  很显然,无论是对于喜欢“折腾”的技术爱好者,还是对有这方面需求的商业用户来说,这都意味着“AI绘图”背后的硬件性价比的再次攀升。其中特别是对于“AI绘图”有着强烈需求的商业用户来说,新的绘图工具就意味着部署的硬件和软件成本都大幅降低,这也将进一步解放“AI绘图”在实际商用场景中的可能性。

  比如电商运营者现在便不再需要依赖画师、广告公司,来进行产品宣传所需的美术设计,而是可以尝试基于AI技术来生成产品宣传图。这不仅能够大幅节约成本和时间,而且即便对效果不满意,也可以无限次重来,直到获得合适的设计为止。毫无疑问,这将会大幅促进电商行业的降本增效,并为生成式AI技术的发展注入了更多的现实需求动力。

  与此同时,随着“A卡炼丹”效率的解封,相信这也将促进生成式AI绘图技术迎来更好、更快的发展。

  当然从另外一个角度来说,它会不会因此使得显卡的价格因此变得更加合理一些呢?

+1

来源:微信公众号 三易生活(ID:IT-3eLife)

延展资讯