艾伦·图灵在1950年提出的图灵测试,至今仍是衡量机器智能的重要标准之一。最近,加州大学圣地亚哥分校的科学家通过一项实验,让500名人类与四种AI语言模型进行了5分钟的对话,其中GPT-4在54%的时间里被误认为是人类,这一结果虽不及人类67%的平均水平,但是已经超过图灵测试的标准,超过30%代表通过图灵测试。
这不仅标志着AI在模仿人类交流方面取得了显著进展,也引发了关于AI可能带来的欺骗性和操纵性问题的新讨论。
艾伦·图灵在1950年提出的图灵测试,至今仍是衡量机器智能的重要标准之一。最近,加州大学圣地亚哥分校的科学家通过一项实验,让500名人类与四种AI语言模型进行了5分钟的对话,其中GPT-4在54%的时间里被误认为是人类,这一结果虽不及人类67%的平均水平,但是已经超过图灵测试的标准,超过30%代表通过图灵测试。
这不仅标志着AI在模仿人类交流方面取得了显著进展,也引发了关于AI可能带来的欺骗性和操纵性问题的新讨论。