文| 小卢鱼
编辑| 杨旭然
“P图”已经是现代人生活的刚需之一,没有拍出能发朋友圈的美照,四舍五入约等于没出去玩。如今AI技术和视觉算法的进步,已经使修图效果更极致,更简单。
当普通人对AI作图的认知还停留在修图、仿制艺术照的时候,关注创作行业的人会发现AIGC已突破“照片”的维度,正在向着“视觉艺术”的高度前进。
2022年美国科罗拉多州博览会艺术比赛就出现了一幅由AI工具Midjourney生成的获奖作品《太空歌剧院》,画中古典贵妇们立于穹顶之上、漫游太空之间,极具视觉震撼力,也让原本只在小众爱好者圈中流行的AI作画进入了大众视野。
国内公司同样在AIGC的赛道上奋勇向前,年初由ChatGPT引发的国产大模型热潮,已经将东风吹向了技术和数据积累更早、更丰富的玩家。
美图,作为美颜、修图界的鼻祖,因为AIGC风口被重新关注,股价涨幅多次领跑港股AI板块,公司15周年发布会第二日(10月10日)的股价更是大涨11.56%。
在本周美国AI芯片出口新规给AI板块带来下挫行情后,美图公司的股价依旧表现出了韧性。市场的认可不仅源自对其AI技术进步的肯定,更是源自对美图公司商业模式转型、打造创意行业新生产力工具的期许。
6月19日,美图首次向外界介绍了自研AI视觉大模型MiracleVision,10月份又更新到3.0版本。在亲自使用了这款视觉大模型之后,《巨潮WAVE》发现,这可能是美图未来几年最有价值的核心技术之一。01 技术助力智能创作
AI是否可以发展出人类的审美能力?0与1的组合是否能迭代出真正的美?这是一个充满哲学意义的问题。如果只把AI当做辅助创作美的工具,那么这项新技术还存在亟需改进之处,比如往往画不好人手等细节。
在大模型的“军备竞赛”中,如何提高精确性和可控性,已经成为了持续迭代的重要方向。
看完美图的发布会后,笔者就以“少女、活泼、阳光、日系、大笑、卖萌、高清、全身、全景、平拍”为关键词,分别利用美图的WHEE、百度的文心一言和阿里的通义万相生成了相关图片。
从真实感、氛围感来说,美图的WHEE表现可圈可点,至少那位从美图WHEE里走出来的少女有着更自然、甜美的笑容,更符合真实的东亚女性形象。
因为Midjourney目前只支持英文输入,笔者又以“Asian girls are lively, sunny, and Japanese style, with smiles and cute outfits”为命令让美图WHEE和Midjourney生成了相关图片。
从颜值来看,两位AI女孩各有千秋,但是美图WHEE对sunny、smile两个细节把握的要更好些,而且还能支持中英文双语输入,对中国用户来说更为友好。
AI生成人像要处理的好,除了整体比例的把握,最重要的就是细节不突兀、可控可调,眉毛、眼窝、苹果肌、下颚、锁骨等等都是细节。美图凭借在图像领域的多年积累,在“美学”方面也算做到了术业有专攻。
这可能与美图公司长期以来对“美学”的追求和对创作者的支持有关。
美图公司除了购买行业数据作为视觉大模型训练的基础素材,更以设计师主导的方式,充分调动了公司设计师资源,和早前为打造设计师生态而孵化的MCP创作者平台,全力参与大模型的训练。
除了数据打底,美图的视觉大模型还有不少转化生产力的妙招,比如AI作图时的提示词智能联想和精准控制。
这是个听起来很像搜狗输入法的功能,但是能够节约时间、提高效率,让图片、视频的制作者能更精确的实现自己的想法,进而大幅提升宣发物料的竞争力。
美图公司试图以提示词串联起用户的“想法”与“手法”,协助智能创作。比如通过输入“近/远景”、“顺/逆光” 、“大/小光圈”等精确提示词,用户就能轻松把控光影等细节,并且调整到自己理想中的成片效果,实现自己的创意。
视觉大模型MiracleVision 3.0在美学基础上,重点增强的可控性可以让用户更细致地调整AI图片的生成效果,让创意工作者的工作效率得到提升,进而实现商业价值。 02 多行业应用落地
3月份,小红书上批量诞生了大量“赛博美女”,这些账号给了市场以新的启示,就是AI作画在市场营销领域蕴含着蓬勃的生机。
通过创造“赛博美女”或其他人物形象,创业者可以创造流量,并以这些流量为基础,通过广告、电商等成熟的线上商业模式进行合作变现。
而从电商业务的视角来看,大模型的辅助下制作商品展示图的门槛和难度将被大幅降低。AI创作团队产出细节精准、人物灵动的高质量商品展示图,可以让这个原本需要大量依赖创意、拍摄的行业成本费用下降,利润相应提升。
根据美图公司在发布会上的介绍,MiracleVision升级到3.0版本后,除了关键词智能联想功能,还提升了局部修改、深化创作的功能。比如用户可以在图中手动圈起需要修改的部分,通过输入文字来进行局部填充,最终修改成功。这对于电商行业来说是非常实用的工具。
电商之外,广告,游戏,动漫,影视这四个与创意密切相关的行业,也是美图公司正在着力开发的B端市场,并且大模型也可以在这些领域发挥出足够的作用:
广告行业,MiracleVision可以用来做平面排版、多尺寸延展、线下投放预览,助力客户在广告物料制作环节提效,还能帮助客户进行头脑风暴、创意深化。
游戏行业,MiracleVision可以包揽场景设计、角色设计、道具设计、UI图标、宣发物料等工作,在降低成本的同时,帮游戏策划师们将想象落实为细节。
动漫行业,MiracleVision打通了概念设计、故事板生成、线稿上色、动漫补帧、视频转动漫等流程,让创作者可以将更多的精力放在塑造人物性格、讲好故事上。
影视行业,MiracleVision的高可控性可充分满足概念场景设计、分镜设计、人物造型、道具设计、宣发物料的效果要求,极大提升影视行业设计环节的效率。
要切入这五大行业的商用市场,不仅要依靠大模型对图片细节的精确可控、深化创作,还要能从工作流上帮设计者、传播者解决上下游、缩短作品平均交付时间的问题。
在美图公司的发展愿景里,从2026年开始,AI视觉大模型的应用普及将进入成熟期,在多个行业的应用落地和创造价值,将成为这个时期的显著特征。毕竟比起美图一年6亿元的研发投入,美图秀秀包年168元的订阅价格并不算贵。
为众多客户降本增效,这不仅是商业用户欢迎的,也是投资人希望听到的。 03 业绩支撑资本市场表现
比应用市场反应更快的往往是股市,美图公司的股价自其加入国内大模型的“百团大战”以来,便一路走高。
从2022年11月算起,美图公司近一年股价累计涨幅已接近4倍。公司股价在3月、6月迎来两轮大幅上涨,年内市值高点突破150亿港元,上半年区间涨幅近119%,是目前港股市场的热门股票之一。
这当然离不开公司业绩改善对股价形成的支撑作用,2023年上半年,美图公司实现总收入12.61亿元,同比增长29.8%;经调整后归属于母公司权益持有人的净利润1.51亿元,同比增长320.4%;月活跃用户数2.47亿,同比增长2.5%。
今年美图公司在财报中将其业务板块重新分类为四大类:影像与设计产品业务、美业解决方案业务、广告业务以及其他业务,原本的VIP订阅业务、互联网增值服务及SaaS及相关业务主要被划入了影像与设计产品业务。
笔者根据相关业务定义,对2021-2023年上半年的业务数据进行了重新分类(结果与真实情况可能略有差异),发现影像与设计产品业务、美业解决方案业务同比增速较快,B端发力明显。
这些数据增长也体现了客户对美图公司AI产品线认可度的提升,美图公司今年能够实现营收增长和扭亏为盈,主要得益于AIGC加持下影像与设计产品(主要是通过VIP订阅收费)收入大幅增长。美图AI不再是一种高科技的噱头,而是逐渐成为日常可用的生产力工具。
有券商认为美图公司在应用场景的精细经营和生产力场景的积极布局,将带动用户付费率和单用户付费按保持增长趋势,打开业绩长期增长的空间。
对中国来说,生产力发展才是硬道理,对中国企业来说,保持业绩增长才是硬道理。随着模型迭代、应用落地、市场扩大,真正优秀的AI行业企业将无惧于拜登政府带来的浮云蔽日。
众所周知百度同样在押注人工智能作为第二增长曲线,百度集团资深副总裁、百度移动生态事业群组总经理何俊杰在9月表示,大模型时代,“竞争的关键不在于做出多少大模型,而在于做出多少AI原生应用。”
这与美图的经营思路暗合。大而全还是小而精,是目前AI领域非常重要的战略分野,也是经营决策者所必须思考和做出决断的。但对于美图来说,重应用、重部分用户的特定需求,是顺理成章且水到渠成的选择。
10月17日百度文心大模型新版本发布后,当天百度还发布了新搜索、新地图等十余款AI原生应用,希望能“激发大家一起来做出更惊艳的AI原生应用来”,这基本上可以标志着行业对于人工智能下一步发展方向的明确,也印证了美图在应用层面重点突破的战略方向的正确性。
这也从一个侧面证明了,每个行业都有机会被AI重做一遍,大模型和AI在应用端的创新,仍是未来很长时间里互联网公司们最重要的业务发展方向。 04 写在最后
作为商家企业,我们应该期待大模型能够为我们的生产经营提高效率,减少成本,如所有企业家对技术、对科技的期待那样;
作为消费者和互联网用户,我们应该期待更多大模型从研发、试用走向商业化应用的落地,因为这意味着更多的方便、便捷和新鲜快乐的体验;
作为投资者,人们也应该对AI的应用抱有更多期待。其中原因就在于,找到更好利用AI的路径,才能让各类企业获得更多的业绩和利润的增量。美图公司股价在颓废不堪的港股市场上的亮眼表现,对此已经有足够强的说服力。
以及,切实可行、能够带来真金白银的AI业务,才能支撑着这些科技公司继续投入研发、迭代模型、创建生态。在迅猛变化的时代中,建立一个技术——资本——技术的正向循环并不容易,但这也正是商业社会中创新、求变与突破的魅力所在。