Sora无法替代人类！亚马逊工程师断言：实际工作冲突不可能靠AI解决

　　本文来自于微信公众号新智元(ID:AI_era)，作者:新智元。

　　【新智元导读】Sora一出，让很多人心生恐惧:饭碗彻底被砸了!这位亚马逊工程师却告诉我们:真的不必担心生成式AI会抢人类的饭碗，顶多担心一下你的人类同行吧。

　　这一周，OpenAI视频AI工具Sora一出现，可谓是炸翻了天。

　　「饭碗保不住了」的恐惧，真实地击中了许多人。

　　不过，亚马逊的一位工程师Cameron Gould则认为，其实并不必对AI如此惧怕，它并不会导致我们失去工作。

　　为什么?原因如下。

　　Prompt的自相矛盾

　　首先，生成式AI应用在创意内容时，生成的一般是图像、视频以及一般的非虚构内容。

　　给一个生成式AI模型prompt，就像照看一个恶毒的孩子，他的唯一目标，就是通过「从字面上理解你所说的一切」来惹恼你。

　　你必须用词准确，不能在不重要的细节上浪费一个字符，因为这可能就会使结果向完全不同的方向倾斜。

　　但是同时，你又需要提供尽可能多的详细信息，让模型不会误解你。

　　这种自相矛盾的操作，简直太糟糕了!

　　跟计算机进行单向对话，试图理解它为什么没能产生自己想要的结果，能让人产生一种连续3小时撞墙的冲动……

　　Gould表示，在自己作为软件工程师的职业生涯中，其实已经习惯了和计算机的这种单向对话，但生成式AI给他的体验，绝对更糟。

　　它不是一种可预测的编程语言，拥有幂等的函数。

　　它完全是一个黑匣子，几乎每次都可以在相同的输入下，产生完全不同的结果。

　　即使在prompt里要求AI要保持一致性，它也未必会听你的。

　　市值数十亿的公司，就曾受到这一现实的困扰。

　　最近，加拿大一家法庭裁定，加拿大航空公司必须向其中一名乘客支付赔偿金，因为聊天机器人提供了误导性建议，导致该乘客为机票支付了近一倍的费用。

　　速度确实快，但……

　　当然，尽管在一致性方面存在缺陷，但生成式AI可以帮我们快速产出东西来。

　　比如上面这张图，就是用生成式AI创建的，只花了几秒钟就做出来了。

　　所以，AI可以让我们比艺术家出图的速度更快，这件事是有可能的。

　　而Sora也让普罗大众就可以用比以往快许多倍的方式，生成更复杂的媒体素材。

　　所以，由于现在一个人可以做几个人的工作，我们真的不需要那么多的艺术家、软件工程师、撰稿人了吗?

　　不，它的细节不对

　　答案并没有那么简单。

　　使用生成式AI创作艺术时，可能你时常会想:「不，这不是我想要的。」

　　这也是在论坛上常常出现的观点。

　　有人会反驳说:这是因为你的prompt缺乏细节，你需要给出更具体的prompt。

　　这个观点确实有道理。

　　我们自己的图片和票房收入超过1亿美元的专业电影，有何不同?

　　我们自己的个人博客，和专业的全职作家的博客，有何不同?

　　我们自己做的游戏视频标题，和30小时的AAA视频游戏标题，有何不同?

　　答案就是细节。

　　正是细节，将业余爱好者和专业人士区分开。

　　如果想使用生成式AI来创作与专业内容一样令人印象深刻的作品，我们将需要一个包含大量细节的提示。

　　此外，还需要大量的试验和错误，才能让模型产生我们想要的东西。

　　生成式AI只是一种工具，类似于自动完成、编译器、拼写检查器或任何其他辅助工具。

　　它不会为你做任何工作，除非是它自己的苦差事。

　　让我们回到Sora的例子。

　　它只能生成无声的视频。其中没有音频，没有对话，没有一个对象可以说话，或者发出声音。

　　但如果我们想用它拍电影，就需要用它——

　　生成脚本?

　　阅读剧本?

　　生成视频以配合脚本?

　　究竟是现代电影的哪些方面，让电影变得有趣呢?

　　突然间，我们就需要集成一堆不同的生成式AI工具，才能完成工作。

　　当然，OpenAI有一个名为Jukebox的音乐生成工具，它可以在视频中添加音乐，但却无法添加对话。

　　在一段视频中，该如何添加对话呢?这项任务听起来太艰巨了。

　　我们不仅需要生成一个特定场景的视频，还需要让场景中角色的嘴部动作和台词保持一致。

　　此外，视频生成器还需要知道单词是怎样说出的。不仅仅是语气，还有节奏。

　　想象一下，要解决全部这些细节，需要多大的人力才能解决?

　　细节，变得相当困难。

　　在每一个步骤的每一个级别上，都有大量会影响实质性后果的细节。

　　Gould表示，自己最近读到一篇非常喜欢的博文《现实拥有惊人的细节量》。

　　现实的细节是无限的，然而AI模型的token却是有限的。

　　它只能带你走这么远，之后，我们就需要依靠其他人来完成工作。

　　目前为止，人类仍然做着最繁重的工作。

　　殖民宇宙的一些重要细节

　　更少的细节，更多的变化

　　专注于细节，听起来实在是太累了。

　　如果让你保持简单，会发生什么呢?如果你只需要提供很短的描述，只用几分钟就可以写出来?

　　最终，你会得到多样化的结果，大部分与你的想法完全不一致。

　　你需要在成百甚至上千个结果中，才能找到你想要的那一个，因为prompt太通用了。

　　你可能永远都找不到一个能用的结果。

　　如果prompt太简单，模型天马行空的想象力，会提供无限的排列供你选择。

　　比如输入这个prompt——「一个男人」，你会得到各式各样的男人。

　　但实际上，我想要的是一个蓝头发、棕色眼睛、留着小胡子、穿着一件黑色夹克、戴着兜帽的男人。

　　如果只输入「一个男人」作为提示，需要多长的时间才能找到确切的输出呢?

　　深度和广度之间有一个平衡点，你可以最大限度地减少你的努力。

　　这就需要对细节进行大量批判性思考，并进行大量搜索。

　　AI不会取代我们

　　所以，为什么说AI不会取代我们?

　　因为，企业并不是为了解决生成图像、视频剪辑这类小问题而存在的。

　　企业是为利益相关者解决更大型、更复杂的问题。

　　解决这些问题最困难的部分，就是后勤工作。

　　解决大型、复杂的问题需要一大群问题解决者的时间和精力，而所有这些问题解决者又需要由其他问题解决者组织起来，以保持事情的进展。

　　如果随机抓来两个人，让他们自我管理、自我组织工作，很可能他们的标准和时间表会不一致。

　　如果你要让他们一起工作，你就得设立标准，让他们在同样的时间工作，并且产生相同质量的结果。

　　凝聚力是一种力量，你需要做一些工作，让独立的单位保持一致。

　　一个团队单独运行，可以顺利完成任务;但是当我们把多个团队引入单个环境中时，就会出现很多冲突。

　　多个相互依赖的团队朝着一个目标努力时，需要一定的凝聚力，才能完成有意义的事。

　　这项「凝聚力」工作其实很复杂，经常需要解决人际冲突，而这些冲突通常是不合逻辑的、情绪化的。

　　显然，AI无法解决这种类型的冲突。

　　总结来说就是——

　　企业通过为很多人/企业解决大问题来赚钱

　　大问题很难解决，因为涉及很多团队

　　我们需要精心策划如何统筹这些团队，来解决人际冲突，并保持凝聚力

　　在解决人际冲突方面，人是最可靠的资源

　　很显然，机器人根本无法胜任这些工作，它们的表现会很糟糕。

　　AI不会抢走你的工作

　　当我们仔细看一下目前生成式AI的现状，这个事实是显而易见的——

　　目前没有任何方法，可以让工作自动化。

　　提示界面和模型缺乏自主性和批判性思维，导致了关键的局限性。

　　没错，生成式AI的确可以让我们提高工作效率，但也就仅此而已。

　　这句话已经被越来越多人所赞同:AI不会抢走你的工作。

　　真正会对你造成威胁的，是会比你更熟练地使用AI工具的人。

　　生成式AI是帮助你加快速度的绝佳资源，但它不会完全自动化你的工作。

　　你要做的，就是把它们添加到你的工具箱，熟练地掌握它们。

Sora无法替代人类！亚马逊工程师断言：实际工作冲突不可能靠AI解决

延展资讯