不得不说,网友真的太会整活了。11月3日,B站UP主“精致的男孩富贵”展示了国内大型语言模型的智商测试。他以一种轻松幽默的方式挑战了这一强大的技术。
在这个视频中,UP主选择了“淘宝问问”和“文心一言”这两个典型的互联网平台,以它们作为代表进行测试。他提出了一系列看似毫无意义的问题,例如,“神父去世了算升职还是降职?”或者“天上有9个太阳的时候,向日葵应该往哪里看呢?” 这些问题都源自于一个著名的互联网段子社区“弱智吧”。
许多网友戏称“弱智吧”实际上是中国人的“图灵测试”,因为它以一种令人困惑的方式考验了人工智能的智能水平。UP主的目标是查看大型语言模型是否能够理解这些抽象但严肃的问题,以及是否能够提供有意义的答案。
然而,结果却让人大吃一惊。即便面对这些毫无逻辑的问题,人工智能也可以一本正经地瞎扯淡。这显示出大型语言模型在逻辑推理方面存在明显不足。尽管这些问题看似无厘头,但它们含有大量的逻辑陷阱,而大语言模型的答案正确率反映了其逻辑能力的局限性。
截至发稿时,UP主的视频已经获得了超过71.1万的播放量,并收获了6.6万的点赞。在评论区,众多网友也积极分享了他们与人工智能互动的经历,使用“弱智吧”的段子挑战大型语言模型的智能。
UP主最后指出,通过使用更多的数据和改进的算法,可以提高模型的推理和决策能力。或许在未来的某一天,人工智能将能够胜过“弱智吧”,并提供更有趣和有意义的回答。这个视频引发了对人工智能能否应对复杂逻辑和无厘头问题的深刻思考,也让人们对技术的发展充满了期待。互联网的精彩之处在于,它不断引领着我们走向未知的未来。