哈佛大学领导的一项研究发现,使用生成式人工智能(AI)的波士顿咨询集团(BCG)的数百名顾问在完成任务的频率、速度和质量方面表现出色,相较于不使用AI的同行,他们的绩效提高了40%。
这项研究由哈佛、沃顿和麻省理工等数据科学家和研究人员进行,是首次对企业中生成式AI的实际应用进行了重大研究。研究起源于ChatGPT于2022年11月公开发布后,引发了各大企业积极探索最佳利用方式的热潮。研究团队在今年1月快速展开研究,并使用了GPT-4进行实验,该模型被普遍认为是最强大的大型语言模型(LLM)。这项研究为企业如何部署AI提供了一些重要的启示。
哈佛本次研究的首席作者Fabrizio Dell’Acqua表示:“我们能够提升这些高薪、高技能的顾问的绩效,他们来自顶尖的MBA学院,从事与日常任务非常相关的工作,平均提高了40%,我认为这真的令人印象深刻。”
尽管报告在九天前公开评审,但除了学术界和其社交圈之外并未引起重大关注。除了其标题外,研究还提供了一些关于何时不使用AI的警示性发现。研究得出结论,存在所谓的“崎岖技术边界”,即AI可以轻松完成的任务与当前AI能力之外的任务之间存在难以辨别的障碍。
该研究还指出了一些技术能力较强的顾问采用的AI使用模式,研究人员将其称为“Cyborg”和“Centaur”行为,他们认为这可能指出了如何处理对AI能力存在不确定性的任务的方向。
这项研究的重要发现之一是AI具有平衡技能的能力。在研究之前表现最差的顾问,在使用AI后绩效提高了43%,而对顶级顾问的提升较小。
研究的主要结论之一是,AI的内部工作方式仍然不透明,很难确定在某些任务中何时可靠使用AI,这是未来组织面临的主要挑战之一。
但是,报告指出,一些顾问似乎比其他人更好地穿越了这一技术边界,他们被称为“Centaurs”或“Cyborgs”,以一种结合了人工智能和人类工作优势的方式来回切换。 Centaurs在人和机器之间有明确的界限,根据每个任务的感知优势和能力,在人工智能和人工任务之间切换。 Cyborgs则在执行大多数任务时将机器和人类相融合。
研究还发现,一些任务对AI的表现一直较好,这与目前的一些实践相矛盾。公司不应该错误地认为AI最适合作为第一稿生成,并强制人工干预。相反,公司应该让AI做它真正擅长的事情,而人工则应该尝试深入挖掘其他任务。