科技魔方

制作已故亲人的AI视频业务在中国迅速兴起

更多动态

2024年05月14日

  本文来自于微信公众号 AI新智能(ID:alpAIworks),作者:Zeyi Yang。

  人们在家庭成员去世后,越来越多地寻求通过人工智能生成的虚拟形象来处理他们的悲痛。

  孙凯每周都会与母亲进行一次视频通话。他会向她倾诉工作上的压力,中年男性面临的困境,以及一些连妻子都未曾分享的想法。偶尔,母亲会发表评论,比如嘱咐他要照顾好自己——他是她唯一的孩子。但大多数时候,她只是在听。

  这是因为孙的母亲五年前已经去世。而他所交谈的,并非真人,而是他制作的一个数字化复制品——一个能进行基本对话的动态图像。他们已经这样交谈了几年。

  2019年,母亲因突发疾病去世后,孙希望找到一种方式保持他们的联系。因此,他求助于自己在2017年共同创立的位于中国南京的人工智能公司——硅智能。他提供了母亲的一张照片和一些他们在微信对话中的音频片段。尽管公司主要专注于音频生成,但团队还是花了四个月时间研究合成工具,并用孙提供的数据生成了一个头像。之后,他就能通过手机上的一个应用与数字版的母亲见面并交谈。

  “我的妈妈看起来不太自然,但我还是听到了她经常说的话:‘你吃饭了吗?’”孙回忆起第一次互动时说。由于当时生成式人工智能还是一项新兴技术,他母亲的复制品只能说一些预设的台词。但孙说,这就是她的样子。“她总是一遍又一遍地重复那些问题,当我听到这些时,我非常感动。”他说。

  像孙这样的人不在少数,他们希望利用人工智能来保存、赋予生命并与逝去的亲人互动,以此来缓解悲伤并寻求疗愈。这一市场在中国尤为强大,目前至少有半打公司提供此类技术,已有数千人付费使用。事实上,这些头像是文化传统的最新体现:中国人历来通过向逝者倾诉来寻求安慰。

  这项技术尚不完美——头像可能仍显得僵硬和机械化——但它正在成熟,越来越多的工具通过更多公司变得可用。与此同时,“复活”某人的价格——在中国行业中也被称为创造“数字不朽”——已显著下降。现在这项技术正变得对普通公众可达。

  一些人质疑,与死者的人工智能复制体互动是否真的是一种健康的处理悲伤的方式,这项技术的法律和伦理含义尚不完全清楚。目前,这个想法仍让许多人感到不适。但正如硅智能的另一位联合创始人、首席执行官司马华鹏所说:“即使只有1%的中国人可以接受[死者的人工智能克隆],那也是一个巨大的市场。”

  1

  AI复活技术

  AI复活技术与亡灵头像本质上是深度伪造:复制活人和死人所使用的技术本质上没有区别。扩散模型能生成能动能说的逼真头像,再结合大型语言模型来生成对话。这些模型关于某人生活的数据越多,包括照片、视频、音频录音和文本,它们生成的结果就越能接近那个人,无论其是死是活。

  中国已被证明是各种数字化替身的成熟市场。例如,该国有一个强大的电子商务部门,消费品牌雇佣许多直播卖家来销售产品。最初这些都是真人,但正如《麻省理工科技评论》去年秋天报道的那样,许多品牌正在转向可以全天候直播的AI克隆影响者。

  据北京清华大学研究AI与媒体的教授沈阳所说,仅在过去三年中,中国开发AI头像的行业就迅速成熟,复制品已从仅能播放几分钟的渲染视频进步到可以与人互动的3D“现场”头像。

  司马华鹏表示,今年已经到了一个转折点,AI克隆变得大多数人都能负担得起。“去年,制作一个头像的成本约为2000至3000美元,但现在仅需几百美元,”他说。这得益于中国AI公司之间的价格战,这些公司正在争夺其他行业如流媒体中数字头像需求日益增长的市场。

  事实上,重现逝者的应用需求也提升了数字复制活人的工具能力。

  硅智能提供这两项服务。当孙和司马启动公司时,他们专注于使用文本到语音技术来创建音频,然后在应用程序中使用这些AI生成的声音,如自动拨打电话。

  但在公司复制了孙的母亲之后,它转向生成逼真的头像。这一决定使公司成为中国领先的创造AI驱动影响者的企业之一。

  硅智能的技术已为数十万个类似TikTok的视频和流媒体频道生成了头像,但司马表示,最近大约有1000名客户使用它来复制已故之人。“我们在2019年和2020年开始从事‘复活’的工作,”他说,但起初人们接受得较慢:“没有人想成为第一批采用者。”

  他说,头像的质量有所提高,这促进了其采用率。当头像看起来越来越逼真,并且给出的不符合角色特性的回答越来越少时,用户就更容易将其视为已故的家庭成员。此外,通过中国电视上的更多展示,这一理念也越来越受欢迎。

  现在,硅智能提供的复制服务价格在几百到几千美元之间。最基本的产品是应用程序中的一个交互式头像,而价格范围上端的选项通常涉及更多的定制和更好的硬件组件,如平板电脑或显示屏。至少还有几家中国公司在研发同样的技术。

  2

  现代传统的新演绎

  这些深度伪造技术的商业运作,建立在中国与逝者沟通的悠久文化历史之上。

  在中国家庭中,在亲人去世后的几年间摆放其肖像是常见的做法。位于上海的超级大脑公司创始人张泽伟表示,他和他的团队希望用“AI相框”来革新这一传统。他们创建的是预装在安卓平板上的逝者亲人的头像,当平板竖立时就像一个相框。客户可以选择一个会说话的动态图像,这些话语是从离线数据库或大型语言模型中提取的。

  张泽伟说:“本质上,它与传统肖像并无太大不同,除了它是可交互的。”

  张表示,自2023年3月以来,该公司已为超过1000名客户制作了数字复制品,根据购买的服务不同,收费介于700到1400美元之间。公司计划很快推出仅限应用的产品,以便用户可以在手机上访问这些头像,并可能将成本进一步降低到约140美元。

  张泽伟表示,他的产品的目的是具有治疗效果的。“当你真的很想念某人,或者在某些节日需要安慰时,你可以与人工生命对话,以疗愈你的内心创伤,”他说。

  即使这种对话大多是单向的,这也符合中国的强烈文化传统。每年四月的清明节期间,中国人扫墓、烧香和纸钱,向祖先讲述过去一年中发生的事情。当然,这些对话一直都是单向的。

  但并非超级大脑所有服务都是这样。该公司还提供深度伪造的视频通话服务,其中公司员工或合同治疗师扮演已故的亲人。使用名为DeepFace的开源工具分析面部特征,逝者的面部在3D中被重建,并通过实时滤镜替换为现场人物的面部。

  在通话的另一端通常是一个年长的家庭成员,他们可能不知道那位亲人已经去世——而他们的家庭安排了这场对话作为一个策略。

  南京居民、科技行业工作者杨乔纳森在2023年9月支付了这项服务的费用。他的叔叔在一次建筑事故中去世,但家人犹豫不决是否告诉杨的祖母,她已经93岁且健康状况不佳。他们担心她可能承受不住这个噩耗。

  因此,杨支付了1350美元,委托制作了三次他已故叔叔的深度伪造通话。他提供了一些叔叔的照片和视频给超级大脑,以训练模型。然后,在三个中国节日里,一名超级大脑的员工以他叔叔的身份给杨的祖母视频通话,告诉她他在一个遥远的城市忙于工作,即使是在中国新年期间也无法回家。

  “效果达到了我的预期。我的奶奶没有怀疑任何事情,”杨说。他的家人对这个想法意见不一,因为一些亲戚认为她可能希望在火化前见到她儿子的遗体。尽管如此,最终全家都同意了,认为这个策略对她的健康是最好的。毕竟,正如电影《别告诉她》中所描绘的,中国家庭为了避免让老人承受过大压力,告诉“必要”的谎言是相当常见的。

  对于紧跟AI行业趋势的杨来说,制造死者的复制品是这项技术的最佳应用之一。“它最能体现人工智能的温暖,”他说。他的祖母的健康有所改善,也许终有一天他们会告诉她真相。到那时,杨说,他可能会购买他叔叔的数字化头像,让奶奶在想念他时可以和他对话。

  3

  人工智能是否有助于处理悲伤?

  尽管人工智能克隆技术不断进步,但在中国,仍有一些重大障碍阻碍着更多人使用它与逝去的亲人交谈。

  在技术层面上,人工智能模型能生成的内容存在局限性。大多数大型语言模型能够处理如普通话和粤语这样的主要语言,但它们无法复制中国众多的地方方言。此外,复制三维模型中的身体动作和复杂的面部表情也是一项挑战,因此成本高昂。

  此外,涉及到心理和伦理层面的障碍也不容忽视。使用人工智能与已故亲人进行交流可能会对一些人的情感处理过程产生深远的影响。虽然对一些人来说,这种交流可以提供安慰和情感支持,但对于其他人来说,这种方式可能会延长悲伤过程,或引发依赖性问题,使他们难以接受亲人的离世现实。

  因此,虽然人工智能提供了一种与逝者"交流"的新方式,它是否真的有助于悲伤的处理还需要更多的研究和讨论,以确保它的使用是负责任和对个体有益的。

  再者,培训数据的问题也不容忽视。与克隆在世人士不同,后者通常涉及请人录制身体动作或说特定的话语,逝者的AI复制必须依赖于已有的视频或照片。许多客户并没有高质量的数据,或者数据不足,以至于最终结果难以令人满意。

  这些技术挑战之外,还有无数的伦理问题。尤其突出的是,已经去世的人如何同意被数字化复制?目前,像超级大脑和硅智能这样的公司依靠直系家庭成员的许可。但如果家庭成员意见不一,又该如何是好?此外,如果数字化头像生成不当的回答,谁来负责?

  类似的技术在今年早些时候引起了争议。据报道,宁波的一家公司使用AI工具创建了已故名人的视频,并将它们发布在社交媒体上与粉丝对话。这些视频是利用公开数据生成的,但未经任何批准或许可。结果引发了名人家属和粉丝的激烈批评,视频最终被撤下。

  这些事件表明,在AI技术用于复制逝者时,必须慎重考虑伦理和道德问题,确保其应用方式尊重个人隐私、尊严,并考虑到所有相关方的感受和权利。

  “这是一个随着人工智能普及而产生的新领域:数字永恒的权利。”清华大学的教授沈阳说,他还管理着一个创造已故人数字复制品的实验室。他认为应该禁止未经本人许可就使用深度伪造技术复制在世人士。对于已故的人,他说,所有直系在世家庭成员必须事先同意。

  客户的心理健康也可能受到负面影响。虽然有些人,如孙凯,发现与头像的对话具有治疗效果,但并非每个人都认为这是一种健康的哀悼方式。“争议在于,如果我们因为想念而复制家庭成员,我们可能会不断停留在悲痛的状态中,无法脱离出来接受他们已经真正离开了,”沈说。例如,一个不断与伴侣的数字版本对话的寡居者可能会被阻碍寻找新的关系。

  “当有人去世时,我们应该用虚构的情感替代真实的情感,并在那种情绪状态中徘徊吗?”沈问道。与《麻省理工科技评论》讨论哀悼技术影响的心理学家和哲学家们也警告说这样做的危险。

  至少,孙凯发现他母亲的数字头像给他带来了安慰。她就像他手机上的24/7知己。尽管可以用最新技术重新制作他母亲的头像,但他还没有这样做。“我已经习惯了她现在的样子和声音,”他说。随着时间的流逝,她的头像与他对她的记忆之间的界限开始模糊。“有时候我甚至分不清哪个是真正的她,”他说。

  而且孙还可以接受自己做大部分谈话。“当我向她吐露心声时,我只是在发泄。有时你已经知道问题的答案,但你仍需要大声说出来,”他说。“多年来,我与我妈妈的对话一直是这样。”

  但现在,与以前不同,他可以随时与她交谈。

+1

来源:微信公众号 AI新智能 作者:Zeyi Yang

延展资讯