科技魔方

AI 如何颠覆社交互动?两位 Snap 工程师做了这款表情包产品

更多场景

2024年05月23日

  本文来自于微信公众号深思SenseAI(ID:gh_a54fc6d3826c),作者:SenseAI。

  “生成式 AI 技术正引领一场社交媒体自我表达的革命。从Remini的黏土滤镜到 Easel 的表情包,图像生成领域的创新产品不断涌现。生成式技术、社交媒体与自拍照的结合,为用户提供了前所未有的个性化和创意表达空间。“

  Sense 思考

  我们尝试基于文章内容,提出更多发散性的推演和深思,欢迎交流。

  个人天生就有寻求和表达真实自我的倾向,而社交媒体 App 提供了一个舞台,让人们通过图像进行自我意识形态的表达。

  在传统滤镜时代,图像的表义能力是被摄像头所限制的。而生成式 AI 的出现,让用户的表达力从「现实增强」升级为了「想象增强」,并催生出更多新形式的内容和全新的内容载体。

  妙鸭、Remini 和Easel只是图像社交革命的前菜,让我们拭目以待。

  本篇正文共4137字,仔细阅读约10分钟

  AI Native产品分析

  45

  1. 产品:Easel

  2. 产品上线时间:2023年12月8日

  3.创始团队:

  Rajan Vaish:CEO,联合创始人。前 Snap高级研究工程师。

  Sven Kratz:联合创始人。前 Snap高级研究工程师。

  4. 产品简介:

  Easel 是一款图像社交产品,它巧妙地利用自拍表情包作为切入点,利用生成式 AI 技术,为用户提供了将自拍转化为有趣、个性化的表情包的功能。Easel 目前只能用于 iOS 平台,需要与 iMessage 一起配合使用。

  5. 融资情况:

  265万美元天使轮融资。投资者包括 Unusual Ventures、f7Ventures 和 Corazon Capital 以及各种天使投资者(包括斯坦福大学的几位教授)。

  01.

  从 Remini 的爆火讲起

  社交媒体上的人像照,早已成为流行的风向标。从 iPhone4引领的前置摄像头革命,到移动互联网创业公司们利用光学传感器、手机算力和图像算法的“黄金三角”组合,社交网络的每一次变革都伴随着人像照的流行文化更迭。

  从 Instagram 的照片滤镜,到 SnapChat 的 AR 滤镜,再到去年爆火的妙鸭相机,每一次技术的跃进都为人像照赋予了新的生命。

  在2024年的五一劳动节期间,一款名为 Remini 的 App 异军突起,迅速风靡小红书、抖音等社交媒体。这种滤镜将用户的形象转化为粗糙、笨拙的黏土动画片风格,与主流的美颜文化形成鲜明对比。这种「蠢萌」的黏土风格,为用户带来了一种自嘲式的幽默感和心理慰藉。

  在 Remini 于内网大热的同时,另一家美国西海岸的初创公司正在探索另一条商业化道路。它们将图像生成与自拍表情包加以结合,基于 Apple 平台推出了 Easel,这是一款可在 iMessage 上通过图像生成即时制作表情包的 App。

  02.

  Easel + iMessage =

  下一个 SnapChat?

  Easel,这款由 Snap 两名前员工创立的 App,似乎正在酝酿一场新的社交革命。其联合创始人兼首席执行官 Rajan Vaish,曾在 Snap 任职五年,亲眼见证了人脸滤镜如何掀起流行文化的巨浪。而今,Rajan 意欲借助生成式 AI 再度掀起新一轮的流行文化热潮。

  他选取了表情包这一高频用图场景作为突破点。与妙鸭相机的体验相仿,当用户首次使用 Easel 时,它会抓拍数秒钟的用户面部照片,以构建一个定制化的个人形象模型——不出所料,其背后运用的正是 Stable Diffusion 的开源生态的技术。

  Easel 的创新之处在于,它将表情包与叙事相结合,使得图像不仅仅停留在「美照」层面,更是用户沟通、表达和情感传递的媒介。

  在 Easel 的玩法中,用户可以通过简单的场景描述词,为 @ 的人生成包含其形象的场景画面。这不仅激发了用户的创作欲望,也促进了社交互动的裂变。当对方看到这张图后,很可能会产生回应的动机,进而下载 Easel App 并使用「Remix」功能进行二次创作,形成病毒式的互动循环。

  为了降低创作门槛,Easel 也准许用户将生成的图像发布到应用内的社区中,如此一来,特定的节日或事件或许会引发特定的内容主题,从而提升用户的参与热度。

  在 App Store 上,Easel 获得了5.0的满分好评,尽管仅有21个用户参与了评分。其中一条评论兴奋地写道“欢迎来到社交媒体的未来”,并表示自己已经生成了500张图来与所爱的人分享。

  那么,问题来了,Easel + iMessage 会成为下一个 SnapChat 吗?

  03.

  社交媒体与自我表达

  的心理学

  社交媒体已经成为现代人表达自我、展示个性的重要平台。在这个过程中,「自我决定理论」(Self-Determination Theory,SDT)为我们提供了一个深入理解社交媒体自我表达心理的视角。

  该理论指出,人类天生具有追求和表达真实自我的内在动机,而当个体的基本心理需求——自主性(Autonomy)、能力性(Competence)、和关联性(Relatedness)——得到满足时,这种动机将得到加强。社交媒体应用程序正是通过提供一个展示和交流的舞台,来满足这些基本心理需求,而人像照则成为用户自我表达的重要载体。

  在传统滤镜时期,图像的表意能力被摄像头所局限。用户仅能通过滤镜、AR 人脸贴纸等方式来实现「现实增强式」的自我表达。然而即便如此,上一轮以人脸关键点为核心的 AI 技术浪潮依然催生出了如抖音、美图、FaceU 等现象级产品。

  而生成式 AI 的出现,为用户的自我表达安上了想象的翅膀,图像的「表意能力」得到进一步释放。用户的表达力从「现实增强」升级为了「想象增强」——用户能够利用文字来描述其最为天马行空的场景想象,再让扩散模型将其绘制出来。现实的次元壁被打破,用户首次看到了自己在吉卜力漫画、皮克斯动画、水彩、素描,甚至是文艺复兴时代的油画大师笔下的模样。

  与上一代以「美颜」为代表的应用相比,生成式 AI 图像生成应用具有更强的内容属性、更多的互动玩法和更广的美学风格。这不仅能够满足用户对于美的追求,更能够激发用户的创造力和想象力,让他们能够更加自由地表达自我。

  04.

  技术与需求的双向奔赴

  生成式AI在商业领域成功落地的关键之一在于消弭幻觉、提高可控性。这条技术优化路径不仅适用于大型语言模型(LLM),也同样适用于扩散模型(Diffusion Model)。回顾图像生成技术的发展历程,早期模型由于可控性较差,其应用场景主要局限于「文生图」形式。这导致市场上的产品同质化严重,用户难以对图像生成过程进行有效控制。

  然而,伴随Lora、ControlNet、IPAdapter、InstantID,乃至最新的 PuLID 等一系列新技术的出现,被生成的图像有机会和用户给定的参考图,尤其是 IP(个人形象)构建语义关联,使得图像在生成的同时能够保留人物的高维度面部特征,进而更进一步强化了用户表达自我的能力。

  历史再一次表明,在图像产品领域,技术和需求的双向奔赴,往往首先会在人像照的应用场景得以实现。图像生成类的产品开始逐渐加入面部控制能力,催生出换脸、保 ID 生图等新的玩法。这里面也包含了笔者上一次创业所做的 Stylar.ai 这款产品。

  然而,由于大模型的技术特性,目前的图像生成还很难做到「百发百中」,用户往往需要在几张、几十张的生成结果中才能挑中他所满意的那一张。这是因为在图像生成领域仍然有很多可控性问题有待解决,而可控性势必带来交互体验上的复杂性。

  作为 C 端消费级产品来说,如何平衡技术、商业和用户体验,仍然是一个很考验产品智慧的问题。

  Easel 很巧妙地采取了「自拍表情包」这个视角,一方面它的传播限制在少数亲密关系链的对话场景中,另一方面它的表义性大于美颜性,因此从一定程度上做到了「扬长避短」,具有更大的技术容错空间。

  05.

  生成式 AI 与

  图像社交的未来

  随着大型模型技术的不断进步,我们正处于一个快速演变的时代,每天都有新的研究论文和技术突破涌现。在这样的背景下,我们可以预见,将会有更多类似Remini和Easel这样的创新产品和流行应用不断涌现,为图像社交领域带来新的活力。

  作为深度参与这一变革的观察者,笔者认为以下几个技术趋势值得特别关注,它们有潜力催生出颠覆性的新产品:

  1. 移动端端侧的实时计算技术

  随着模型压缩技术的发展和端侧 NPU 芯片的成熟,加之新一代 iPhone 的推出,移动端市场将迎来新的机遇。端上计算将重塑图像生成产品的市场格局,推动更多以娱乐为导向而非仅仅定位于效率工具的图像社交产品问世,同时提升类似 Easel 这样的应用的用户体验。

  2. 文字生成与自动排版技术

  文字生成能为图像赋予表意能力,自动排版则可为图像增添平面设计能力。这两者的结合将推动图像生成产品超越单一素材生成的局限,向更全面的商业级应用发展,催生出海报设计、漫画创作、广告制作等垂直领域的应用。

  3. 数字人与角色动态驱动技术

  随着虚拟人技术的不断进步,图像和个人IP形象将被赋予更加丰富的情感、智慧和表达力。这种技术不仅可以应用于短视频和直播,还将促进全新的陌生人社交场景的诞生。

  4. 新的图像格式和内容裂变

  传统的位图格式以像素作为存储单元,但生成式图像包含了大量的「元信息」,这些元信息如同图像的DNA,将引领新的图像格式和内容裂变玩法。在这个过程中,每一个创作者都将作为版权链条的一部分被记录下来,这将促进创作生态的健康发展。

  5. 空间计算与3D 生成

  众多创业公司如Luma AI、Spline、Genmo 等正在积极探索3D 内容生成的解决方案。随着 Vision Pro 等设备的普及,将为3D 内容生成提供更多的训练数据和商业化场景。3D 内容非常契合生成式 AI 所擅长的虚构内容创作场景。生成式技术将为虚构内容创作提供更广阔的舞台。

  展望未来,我们将见证一个更加多元化、个性化、互动式和沉浸式的图像社交新纪元。让我们拭目以待,看看未来将如何展开,而我们又将如何在这个充满创意和想象的世界中找到自己的位置。

+1

来源:微信公众号深思SenseAI 作者:SenseAI

延展资讯